Soluciones para la Protección de la Propiedad Intelectual José María Sierra Cámara Escuela Politécnica Superior Universidad Carlos III de Madrid
Introducción de Marcas de Agua • • • • • • •
Imágenes Audio Vídeo Texto plano Texto con comandos gráficos Código programación HTML
© 2009 evalues
2
Imágenes • Soluciones propias para el marcado de imágenes
Aplicar DCT
© 2009 evalues
Modificar coeficientes DCT
Aplicar IDCT
3
Imágenes • Marcas invisibles: – Se basan en aprovechar la redundancia de las imágenes para cambiar ciertos píxeles sin que cambie el aspecto de la imagen. – Resistencia a las transformaciones de la imagen: • Rotación • Contracción • Cambio de formato • etc. – O decremento de la calidad de la misma
© 2009 evalues
4
Audio • Se basan en modelos psicoacústicos que permiten alterar la señal de audio para introducir la marca de agua sin que el cambio sea audible. • Más complicado introducir en formatos comprimidos (.mp3) • No se deben eliminar con transformaciones (cambio de formato, cambio de tasa, conversiones AD/DA) • Soluciones: – Spread Spectrum (dominio de la frecuencia) – Echo-hiding watermarking (dominio temporal) – Bit-stream watermarking © 2009 evalues
5
Video • Requisitos: – Robustez a conversiones NTSC/PAL – Detección/Identificación de marcas en tiempo real. – Soporte formatos de compresión. Ej.: MPEG. – Soporte Conversión A/D y D/A.
• Soluciones diferenciadas entre comprimido y no comprimido:
video
– Separación del video entre partes estáticas y partes dinámicas. Mayor dificultad para añadir/eliminar el marcado en partes dinámicas. © 2009 evalues
6
Texto Plano • Dificultad de introducir marcas por falta de redundancia en la información – Posibilidad de jugar con combinaciones de caracteres especiales (UNICODE) – Modificar la sintaxis de las frases de forma que se codifique el mensaje con el cambio en el orden de las palabras en una frase
• Desventajas: – Se puede codificar muy poca información – El algoritmo es dependiente del idioma – No es válido para todo tipo de textos © 2009 evalues
7
Texto con comandos gráficos • En texto en el que se incluyen comandos con información gráfica (PostScript, PDF, etc.) es más sencillo ocultar información que en texto plano (y más dificultosa de detectar) – Line-Shift Coding: Desplazamiento vertical de una línea con respecto a las otras – Word-Shift Coding: Desplazamiento horizontal de una palabra. – Character Coding: Cambiar características (altura, posición, etc.) de una letra
• Las marcas son difíciles de detectar de manera visual pero fácilmente detectables si se mira el código • Si se detectan se pueden eliminar sin demasiada dificultad
© 2009 evalues
8
Código programación • El código de programación se puede alterar normalmente de forma más sencilla que el texto plano para introducir una marca sin que cambie su funcionamiento – El número de símbolos que hay en un programa es mayor que en un texto plano (guiones, llaves, tabuladores, corchetes, etc.) – El espaciado suele ser más libre que en un texto plano – Se puede meter información en comentarios que no afecta al funcionamiento
• Depende del lenguaje del programación – Algunos son más estrictos en cuanto a la sintaxis que otros
• Adicionalmente, un programa es más complejo de copiar que un texto (si se modifica mucho no funciona), y al copiarse más literalmente es más sencillo que se copien tal cual las marcas introducidas © 2009 evalues
9
HTML • Se pueden utilizar las formas de marcar el texto plano (cuando lo que se quiere proteger es el contenido) – Se pueden incluir marcas en el propio código HTML – Codificar con minúsculas y mayúsculas en los tags – Codificar el mensaje con caracteres no imprimibles (que no muestra en navegador) – Desventajas: • Se puede seguir copiando el contenido de la página y se salta las marcas hechas en el HTML • Si se copia el código HTML en un editor de textos, las marcas se reconocen fácilmente
• Si se quiere evitar que se copie el código HTML, se puede ofuscar de tal manera que no sea fácilmente legible ni utilizable – Pero se puede seguir copiando el contenido de la página sin meterse a copiar el código fuente HTML © 2009 evalues
10