EstadĂstica para periodistas, publicitarios y comunicadores Jordi A. Jauset
Título original: Estadística para periodistas, publicitarios y comunicadores. Aplicaciones de los porcentajes y diseño e interpretación de encuestas. 110 ejercicios y cuestiones prácticas © 2007 Editorial UOC Rambla del Poblenou, 156 08018 Barcelona www.editorialuoc.com Realización editorial: El Ciervo 96, S. A. Calvet, 56 08021 Barcelona taller@elciervo.es ISBN: Xxxxxxxx Depósito legal: Xxxxxx Ninguna parte de esta publicación, incluyendo su diseño general y el de la cubierta, puede ser copiada, reproducida, almacenada o transmitida de ninguna manera ni por ningún medio, tanto si es eléctrico como químico, mecánico, óptico, de grabación, de fotocopia o por otros métodos, sin la autorización previa por escrito de los titulares del copyright.
Autor Jordi A. Jauset Doctor en Comunicación por la Universitat Ramon Llull (URL) e Ingeniero de Telecomunicación por la Universitat Politècnica de Catalunya (UPC). Es master en Administración de Empresas por la Universidad Politécnica de Madrid (UPM) y en Prevención de Riesgos Laborales por el Institut Químic de Sarrià (URL). Ha realizado, también, estudios de doctorado en Ingeniería Biomédica (UPC). Siguiendo la tradición familiar, finalizó los estudios musicales como profesor de piano, en el Conservatorio Profesional de Música de Zaragoza. Su biografía musical es muy extensa, habiendo obtenido importantes premios internacionales como intérprete, en solitario y junto al grupo musical leridano formado con sus hermanos, durante los años 1964 a 1982.1 Su actividad profesional la ha desarrollado principalmente en RTVE, habiendo desempeñado distintas responsabilidades en las tres sociedades del grupo en Cataluña: director del Instituto Oficial de Radio y Televisión, jefe técnico territorial de RNE y subdirector económico de TVE. El pasado año fue nombrado, eventualmente, director de la Oficina de Comunicació del Govern de la Generalitat de Catalunya (Presidència), asumiendo las funciones y responsabilidades de la Subdirección General de Medios Audiovisuales, con el objetivo principal de impulsar la implantación de la televisión digital terrestre en Catalunya. Es profesor de Estadística y de Métodos de Investigación en las Facultades de Ciencias de la Comunicación de la Universitat Ramon Llull y Universitat Autònoma de Barcelona. En ellas imparte, también, seminarios sobre audiencias de televisión en diversos programas de posgrado. En materias tecnológicas, colabora con las Escuelas Universitarias Gimbernat (UAB) en los estudios de Graduado y Master en Multimedia. Su interés como investigador se orienta en dos líneas bien diferenciadas: por una parte, el impacto social de los medios de comunicación y, por otra, los efectos y aplicaciones científicas de la música, como herramienta terapéutica en determinadas disfunciones físicas y emocionales. En dichos aspectos, colabora con grupos de investigación de diversas facultades de la Universitat Ramon Llull. Ha publicado diversos trabajos académicos, ponencias y artículos en revistas especializadas en los ámbitos de las audiencias de radio y televisión, informática musical y tecnología aplicada a los medios de comunicación. Su libro “La investigación de audiencias en televisión. Fundamentos estadísticos” (Paidós, 2000), es considerado como uno de los manuales de referencia, en el ámbito académico, sobre el estudio y análisis de las audiencias televisivas.
1. Echauz, P. “¡Qué tiempo tan feliz! La Vanguardia [Barcelona] (20 junio 2005), Vivir, p.5. De Castro, J., Oró, A. y Ruíz, J.M. (2005) Quan Lleida era ye-yé (Música “moderna” i societat 1960-1975). Lleida, Pagés editors.
A mi profesor particular de matemテ。ticas, Teniente Coronel テ]gel Rico (q.e.p.d.), por hacerme fテ。cil lo difテュcil
Agradecimientos
Recuerdo, con cierta añoranza, las clases de cálculo mental recibidas en mi infancia durante los primeros años de bachillerato. En ellas descubrí que tenía cierta facilidad con los “números”, posiblemente debido a mi temprana iniciación musical. Según explican los neurocientíficos, el aprendizaje musical produce un aumento de las conexiones neurales (sinapsis) que estimulan la creatividad así como determinadas capacidades, entre ellas, la numérica.1 A pesar de ello, las matemáticas no eran una de mis asignaturas preferidas. Dado que mi interés se dirigía hacia el estudio de una carrera de ingeniería, y el álgebra junto con el cálculo eran las materias “duras”, decidí prepararme con tiempo asistiendo a clases particulares. Durante tres años, a razón de tres horas semanales, descubrí que las matemáticas no eran tan difíciles como me parecían y que, incluso, me gustaban. La sencillez de las explicaciones, planteamientos, coherencia y raciocinio lógico eran las premisas y habilidades de mi profesor. Ejemplo tras ejemplo, después de una breve explicación teórica, me enseñaba a razonar y entender por qué se aplicaba una u otra fórmula y el sentido que tenía, sin olvidar la interpretación final del resultado hallado, valorando su coherencia o lógica con el planteamiento inicial del ejercicio. Una metodología simple pero, a la vez, eficaz. Los conocimientos que me transmitió fueron de gran ayuda, no solamente para superar con éxito mi formación universitaria, sino posteriormente ante el reto que supone preparar a universitarios para formar a futuros profesionales. Muchas veces he recordado esas clases y el entorno en el que se desenvolvían: una pequeña habitación de apenas seis metros cuadrados, una iluminación tenue, la voz potente de mi profesor y un silencio sepulcral mientras intentaba resolver los ejercicios que me proponía, perturbado, en algunas ocasiones, por el lloriqueo de su hijo pequeño. A él, Teniente Coronel Ángel Rico, q.e.p.d., va dedicada, especialmente, esta obra.
1. Graziano A., Peterson M., y Shaw G. Neurological Research, Volume 21 [1999], pp. 139-152. Fujioka, T et alii “One year of musical training affects development of auditory corticalevoked fields in young children” Brain (7 setember 2006), pp. 1-16.
Debo agradecer los consejos de Philipp Fürst, director general de Barcelona de Zenitmedia, por sus sugerencias y por facilitarme diversos ejemplos prácticos sobre planificación de medios, algunos de los cuales se han incluido en la obra. También a los profesores y compañeros de la facultad de Ciencias de la Comunicación de Blanquerna, Jordi Busquet, Jordi Botey y Lluis Jornet por las conversaciones mantenidas al respecto y, a Lluis Pastor, director de la editorial UOC, por la confianza demostrada en el encargo del libro. Finalmente, a mi amigo Ramón Font, periodista, ex-secretario de Comunicació de la Generalitat de Catalunya, mi agradecimiento por su colaboración en el prólogo y presentación de este libro.
© Editorial UOC
13
Índice
Índice
Dedicatoria ........................................................................................................................................................................ Agradecimientos .................................................................................................................................................... Índice .............................................................................................................................................................................................. Introducción ..................................................................................................................................................................
9 11 13 17
Capítulo I. Los porcentajes ............................................................................................................ 1. Definiciones .................................................................................................................................................................. 1.1. Fracciones .......................................................................................................................................................... 1.2. Ratios .......................................................................................................................................................................... 1.3. Porcentajes ...................................................................................................................................................... 2. Operaciones básicas ...................................................................................................................................... 2.1. Conversión de una cantidad en un porcentaje .................................. 2.2. Cálculo del porcentaje de una cantidad ........................................................ 2.3. Variaciones porcentuales .......................................................................................................... 2.3.1. Falsas interpretaciones ............................................................................................ 2.3.2. Cálculo de los valores inicial y final ................................................ 2.4. Precauciones .................................................................................................................................................. 3. Ejemplos prácticos .......................................................................................................................................... 3.1. Ejercicios comentados .................................................................................................................. 3.2. Ejercicios propuestos: autoevaluación ................................................................
23 23 23 24 24 25 26 27 28 30 31 32 34 34 57
Capítulo II. Aplicaciones prácticas ................................................................................ 1. Las audiencias de televisión .......................................................................................................... 1.1. La medición de la audiencia .............................................................................................. 1.2. Definiciones .................................................................................................................................................. 1.2.1. Audiencia ...................................................................................................................................... 1.2.1. Rating .................................................................................................................................................. 1.2.3. Audiencia media ..............................................................................................................
73 74 74 75 77 78 79
© Editorial UOC
14
Estadística para periodistas, publicitarios...
1.2.4. Cuota de pantalla (share) .................................................................................. 1.2.5. Rating y share ........................................................................................................................ 1.2.6. Otros indicadores ............................................................................................................ 1.3. Ejemplos prácticos .............................................................................................................................. 1.3.1. Ejercicios comentados ............................................................................................ 1.3.2. Ejercicios propuestos: autoevaluación .......................................... 2. Tabulaciones de datos y resultados .................................................................................. 2.1. Ejemplos prácticos .............................................................................................................................. 2.1.1. Ejercicios comentados ............................................................................................ 2.1.2. Ejercicios propuestos: autoevaluación ..........................................
80 82 83 85 85 97 106 109 109 114
Capítulo III. Los estudios en muestras. Fundamentos .......... 1. Estudios de investigación. Planificación ................................................................ 2. El muestreo .................................................................................................................................................................. 2.1. Muestras o universos ...................................................................................................................... 2.2. Tamaño de la muestra .................................................................................................................. 3. Definiciones .................................................................................................................................................................. 3.1. Universo .............................................................................................................................................................. 3.2. Marco de muestreo ............................................................................................................................ 3.3. Muestra .................................................................................................................................................................. 3.4. Muestra sesgada ...................................................................................................................................... 3.5. Fracción de muestreo (F) .......................................................................................................... 3.6. Coeficiente de elevación (C) .............................................................................................. 3.7. Unidad elemental ................................................................................................................................ 3.8. Unidades de muestreo .................................................................................................................. 3.9. Estudios de variables y/o atributos .......................................................................... 4. Ejemplos prácticos .......................................................................................................................................... 4.1. Ejercicios comentados .................................................................................................................. 4.2. Ejercicios propuestos: autoevaluación ................................................................
121 122 124 125 125 126 126 127 128 129 130 131 131 131 132 133 133 136
Capítulo IV. Métodos de selección de muestras .................................. 1. Método de muestreo .................................................................................................................................... 1.1. Métodos probabilísticos................................................................................................................ 1.2. Métodos no probabilísticos .................................................................................................... 2. Muestreo probabilístico: .................................................................................................................... 2.1. Muestreo aleatorio simple ........................................................................................................ 2.2. Muestreo aleatorio sistemático ........................................................................................ 2.3. Muestreo aleatorio estratificado ...................................................................................... 2.4. Muestreo aleatorio por conglomerados ..............................................................
139 140 140 141 142 142 143 144 147
© Editorial UOC
15
Índice
3. Muestreo semiprobabilístico: rutas aleatorias ................................................ 4. Muestreo no probabilístico: .......................................................................................................... 4.1. Opinático .............................................................................................................................................................. 4.2. Por cuotas ............................................................................................................................................................ 4.3. Bola de nieve (en cascada) ...................................................................................................... 4.4. Accidental (incidental) .................................................................................................................. 5. Ejemplos prácticos ............................................................................................................................................ 5.1. Ejercicios comentados .................................................................................................................. 5.2. Ejercicios propuestos: autoevaluación ................................................................
148 149 149 149 150 150 150 150 163
Capítulo V. Las fichas técnicas ................................................................................................ 1. Artículos en la prensa. Comentarios .............................................................................. 2. Fichas técnicas. Ejemplo ........................................................................................................................ 2.1. Grado de confianza.............................................................................................................................. 2.2. Error muestral .............................................................................................................................................. 2.3. Significado de p y q ............................................................................................................................ 2.4. Método CATI .................................................................................................................................................. 2.5. Ficha técnica del “Pre-referendum estatuto de Catalunya” 3. Ampliación de conceptos .................................................................................................................... 3.1. Error muestral y límites de confianza .................................................................. 3.2. Error muestral real ................................................................................................................................ 3.3. Error estándar ................................................................................................................................................ 3.4. Grado de confianza.............................................................................................................................. 3.5. Errores y tamaños. Fórmulas de cálculo .......................................................... 3.6. Notación matemática ...................................................................................................................... 3.7. Relación entre tamaño y error muestral ........................................................ 4. Conclusiones ................................................................................................................................................................ 4.1. Procedimiento .............................................................................................................................................. 4.2. Corolario................................................................................................................................................................ 4.3. Recomendaciones ................................................................................................................................ 5. Ejemplos prácticos ............................................................................................................................................ 5.1. Ejercicios comentados .................................................................................................................. 5.2. Ejercicios propuestos: autoevaluación ................................................................
169 169 173 175 176 177 177 178 179 179 181 183 184 185 186 187 191 191 192 193 194 194 222
© Editorial UOC
16
Estadística para periodistas, publicitarios...
Anexos .......................................................................................................................................................................... 1. Tabla de números aleatorios .......................................................................................................... 2. Error muestral en función del tamaño de la muestra y de los valores p,q para población infinita (grado de confianza del 95,5%) ...................................................................................................................................................................... 3. Error muestral en función del tamaño de la muestra y de los valores p,q, para población infinita (grado de confianza del 99,73%) .................................................................................................................................................................. 4. Tamaño de una muestra en función del error muestral y de los valores p,q, para población infinita (grado de confianza del 95,5%) .................................................................................................................................. 5. Tamaño de una muestra en función del error muestral y de los valores p,q, para población infinita (grado de confianza del 99,7%) ...................................................................................................................................................................... 6. Tamaño de una muestra en función del error muestral y del tamaño de la población (grado de confianza del 95,5%) .............. 7. Tamaño de una muestra en función del error muestral y del tamaño de la población (grado de confianza del 99,7%) ........
243 243
Bibliografía
251
......................................................................................................................................................................
244
245
246
247 248 249
© Editorial UOC
17
Introducción
Introducción
“El inconveniente de ser de letras”. Este era el titular de una noticia comentada por Roger Jiménez en la que citaba:1 “…un buen reportero no debe limitarse a ser una mera grabadora ni asumir nada gratuitamente…aunque proceda de una figura tan reconocida como la del anterior presidente del Gobierno, sujeto a error como la totalidad del género humano...”
En dicho artículo, Jiménez alude a la intervención de Felipe González en la localidad sevillana de Alcalá de Guadaira, donde ridiculizó al gobierno de José María Aznar por “…presumir de haber destinado 35.000 millones de pesetas a ayudar a 800.000 familias…Yo soy de letras, añadió, pero he hecho la cuenta y salen a 420 pesetas por familia, y si cada familia tiene un mínimo de tres personas, pues veintitantos durillos para cada uno y arreglado el asunto…” Estas declaraciones se difundieron por todos los medios de comunicación sin efectuar comprobación algebraica alguna, excepto por Lourdes Lucio, corresponsal de El País en Sevilla, quién “…al lado de la cita con la cifra errónea advirtió entre paréntesis que el resultado real de la división daba, exactamente, 43.750 pesetas…” El artículo menciona, también: “…no existe la menor duda de que Felipe González expresó los datos tal como fueron escuchados por el auditorio (unas 4.500 personas) y difundidos por todos los medios de comunicación, y así lo confirma el jefe de prensa del Partido Socialista en Andalucía, Miguel Ángel Vázquez: las cifras que salieron publicadas son las que facilitó Felipe González en su intervención, aunque aclaró de antemano que él no era un matemático ni estudió ciencias, sino que era un hombre de letras. Sencillamente, se equivocó al efectuar la operación, un error que podemos cometer todos. Pero los periodistas merecemos un tirón de orejas por aceptar unos datos a ciegas fiados de la personalidad de quién lo dijo…” 1
Jiménez, R. El inconveniente de ser de letras. La Vanguardia [Barcelona] (6 febrero 2000), Vivir, p. 12.
© Editorial UOC
18
Estadística para periodistas, publicitarios...
Resulta curioso que una de las habituales “excusas” de los estudiantes de periodismo, publicidad y comunicación, ante una asignatura como la Estadística, es manifestar que “somos de letras”, negando de antemano su capacidad a entender de “números” o infravalorando la importancia que tienen para su carrera profesional. Si prestamos un poco de atención en la lectura de la prensa diaria encontraremos numerosos ejemplos, en titulares y entrevistas, que dan fe, precisamente, de la importancia de los “números” en determinados entornos profesionales. Citemos, por ejemplo, los siguientes: “Toda editorial que está dirigida por un intelectual fracasa, hay que entender de números” (José Manuel Lara).2 Entrevista a Josep Cuní: “El periodista vuelve a TV3 tras dejar Ona Catalana porque esta radio no supo hacer bien los números” (Pilar Santos).3
También son dignos de mención, los siguientes fragmentos de una entrevista de Lluis Amiguet con Mogens Niss, responsable matemático del informe Pisa sobre rendimiento educativo en la Organización para la Cooperación y el Desarrollo Económicos (OCDE):4 ¿Y usted cree que los políticos saben de lo que hablan cuando hablan de números? Hay de todo. Recuerdo un diputado danés que explicó que el 68% de la población no usaba librerías porque el 37% de hombres y el 31% de mujeres no las visitaban nunca…¡los sumó simplemente! Muy pocos periodistas saben de mates. Por eso los periódicos reproducen tantas declaraciones y tan pocas cifras. Y cuando las citan, a menudo confunden. El Pisa en Dinamarca causó conmoción porque el país había pasado del puesto 12 al 15…¡cuando en el ranking del 2001 hubo 21 participantes y en el 2003, 40! En realidad, estábamos igual.
2
“Lara por Lara”. La Vanguardia [Barcelona] (13 mayo 2003), Cultura, p.42.
3
Santos, P. “Entrevista a Josep Cuní”. El Periódico [Barcelona} (6 setembre 2003), Exit, tele+ràdio, p. 92.
4
Amiguet, Ll. “Al final la política de verdad son números”. La Vanguardia [Barcelona] (20 mayo 2005), La Contra.
© Editorial UOC
19
Introducción
La estadística es la ciencia encargada de recoger, analizar e interpretar los datos numéricos relativos a una serie de observaciones realizadas para su aplicación en la toma de decisiones. Es una ciencia que ayuda a obtener información a partir de datos generalmente numéricos. Esta información permite tomar decisiones reduciendo el riesgo de error. Para ello es necesario disponer de los datos, analizarlos y extraer conclusiones de este análisis con ayuda de conceptos de probabilidad. La estadística se sirve de expresiones matemáticas mediante las cuales evidencia aquellos aspectos más relevantes de la información implícita en los datos y que es difícil de reconocer con un simple análisis visual. Maneja datos numéricos procedentes de grandes o pequeños colectivos y su uso se ha convertido en algo cada vez más común en la vida cotidiana. Están presentes en los presupuestos, en las leyes, en las bases de datos, en los censos, en los sondeos de opinión, en las encuestas...Son utilizados por la administración y empresas públicas5, por la Iglesia6, por la Guardia Civil7, por las peñas futbolísticas8, por las consultoras,9 por los gabinetes de comunicación e investigación de mercados, por la industria en sus procesos de control de calidad,… No hay medio de comunicación que diariamente no ofrezca alguna información en la que se aporten datos estadísticos. Tener conocimientos de estadística es cada vez más necesario en un buen número de profesiones, en política y en la vida cotidiana. Según cita John Allen Paulos, profesor de matemáticas en la Temple University de Filadelfia y autor de best-sellers matemáticos10, “…se puede sobrevivir sin las matemáticas, la gente lo ha hecho durante milenios, pero en las sociedades modernas son cada día más necesarias…”
5. Las encuestas periódicas del Centro de Investigaciones Sociológicas (CIS) y/o Instituto Nacional de Estadística (INE), por citar dos ejemplos. 6. Riera, J. “Estadística de la Iglesia”. La Vanguardia [Barcelona] (16 marzo 2003), Religión, p. 46. 7. Martín, E. “A los ladrones no les gusta madrugar”. La Vanguardia [Barcelona] (26 octubre 2003), Sociedad, p. 38. 8. Calatayud, K. “La estadística pinta negativo”. La Vanguardia [Barcelona] (14 febrero 2000), Lunes match, p. 10. 9. Simón, A. “Cómo utilizar la ciencia para encontrar nuevos clientes”. Cinco días [Madrid], p. última. 10. Corbella, J. “Las matemáticas son impopulares porque se enseñan sin atractivo” La Vanguardia [Barcelona] (14 febrero 2000), Sociedad, p. 38.
© Editorial UOC
20
Estadística para periodistas, publicitarios...
La estadística, sus bases, fundamentos y, especialmente, la fiabilidad e interpretación de los datos, es materia que considero fundamental para cualquier estudiante y/o profesional de los medios. La capacidad de comprender los argumentos basados en cifras es importante para cualquier persona, especialmente, para los comunicadores, incluyendo a los profesionales de la política que, por sus cometidos, manejan e interpretan multitud de datos procedentes de fuentes estadísticas. Tal como exponía Ángel Expósito:11 “….hace unos años, se hablaba de cierta especialización en periodismo de precisión, procedente como siempre de Estados Unidos, tendente a que el informador aprendiera a interpretar gráficos, estadística y cuadros de todo tipo. No estaría de más que esa precisión se trasladara también a los políticos afectados por las encuestas, no vaya ser que, por fijarse en un detalle, se pierdan el conjunto y la tendencia, de modo que al final sea tarde. Los periodistas simplificamos hasta el error, pero que hagan lo mismo los afectados es peor...”
Este libro se basa en mi experiencia como profesor de Estadística Aplicada en la Facultad Ciencias de la Comunicación de Blanquerna (URL) en los últimos 12 años. He seleccionado, en esta obra, aquellos temas de aplicación en la práctica profesional, en los que he observado que existe mayor confusión. Me refiero a los cálculos e interpretación de los porcentajes, índices de audiencia, diseños muestrales, fichas técnicas y resultados de encuestas. He intentado que la redacción y exposición de los distintos temas sea sencilla, de modo que el lector pueda seguir las explicaciones aún cuando disponga de escasos conocimientos matemáticos y, a la vez, práctica, utilizando ejemplos publicados en la prensa escrita, seleccionados a partir de mi lectura diaria. La obra se ha dividido en cinco capítulos, los dos primeros dedicados a los porcentajes y los tres siguientes, a los fundamentos y aplicaciones de la teoría de muestras. Al final de la exposición teórica de cada uno de los capítulos hay un apartado con ejemplos prácticos. En él se muestran una serie de ejercicios comentados y a continuación otros propuestos, a modo de autoevaluación, para que el lector pueda comprobar el progreso y asimilación de los conocimientos expuestos. La mayoría de ejemplos contemplan aspectos reales y prácticos de los campos del periodismo, publicidad y comunicación.
11. Expósito, A. “El mirón perplejo”. La Vanguardia [Barcelona] (23 noviembre 2006), Política, p.23.
© Editorial UOC
21
Introducción
En el primer capítulo se repasan los conceptos y operaciones básicas con los porcentajes, resaltando los errores que frecuentemente se cometen. Aunque el porcentaje no es un concepto estadístico, sino algebraico, he creído oportuno incluirlo a modo de recordatorio ya que es ampliamente utilizado en estadística. Mi experiencia como docente me demuestra que existe cierta dificultad en su manejo e incluso en su interpretación. El segundo capítulo trata de dos aplicaciones interesantes de los porcentajes: las audiencias de televisión y las tabulaciones de datos y resultados de encuestas en tablas horizontales, verticales y absolutas. Los tres capítulos restantes se dedican a los fundamentos del diseño de muestras, especialmente útiles para una correcta comprensión de la metodología en que se basan las encuestas. En ellos se definen aspectos básicos del muestreo, los métodos de selección y una explicación detallada de todos aquellos indicadores que aparecen en las fichas técnicas, para facilitar una interpretación adecuada de los resultados del estudio. La obra se ha concebido, desde su inicio, como un manual de consulta, de repaso y de resolución de ejercicios. Se dirige, especialmente, a los estudiantes y profesionales del mundo de la comunicación y a todos aquellos, incluyendo a los políticos, que deseen conocer un poco más sobre las aplicaciones prácticas del álgebra y la estadística. En algún capítulo se hace mención al programa Excel y a su utilidad para determinados cálculos estadísticos. No cabe duda que es de gran ayuda como herramienta de cálculo al margen de otras aplicaciones más específicas como, por ejemplo, el SPSS.12 Sin embargo, no se entra en detalles ni se explica su manejo, ya que existen buenos manuales al respecto y no se ha planteado como objetivo de esta publicación. Finalmente a ti lector, estudiante o profesional, desearte que esta obra te sea útil para consolidar y afianzar tus conocimientos y, a la vez, de ayuda en el desarrollo de tu carrera profesional. Estaría sumamente agradecido si mi modesta aportación contribuyera a una mejora cualitativa de la información que diariamente se difunde a través de los medios de comunicación.
12. Statistical Product and Service Solutions. Es un programa muy utilizado en las empresas públicas y entidades privadas, con enormes capacidades de cálculo.
© Editorial UOC
23
Capítulo I. Los porcentajes
Capítulo I Los porcentajes
“Las matemáticas son el alfabeto con el cual Dios ha escrito el Universo” (Galileo Galilei)
Cuando se manejan cifras o datos numéricos, es habitual efectuar comparaciones o relaciones entre ellos con el fin de obtener determinadas conclusiones. Las operaciones con porcentajes constituyen una de las partes más elementales del álgebra básica y tienen muchas aplicaciones prácticas en la vida diaria. A pesar de su sencillez, en ocasiones se producen confusiones que pueden dar lugar a errores importantes. Repasaremos en este capítulo las nociones básicas de los porcentajes y, a través de diversos ejemplos, se comentarán algunas de las aplicaciones más destacables en los campos del periodismo, publicidad y comunicación.
1. Definiciones
1.1. Fracciones Una fracción es el cociente de dos cantidades denominadas numerador (dividendo) y denominador (divisor). Si el denominador es superior al numerador, el resultado es inferior a la unidad y la fracción se llama “propia”.
© Editorial UOC
24
Estadística para periodistas, publicitarios...
Uno de los casos de fracción propia es aquél en el que se relaciona una parte (numerador) con un total (denominador). El resultado siempre es inferior a la unidad, y se dice que el resultado está expresado en tantos por uno.
1.2. Ratios Un ratio es la relación o cociente entre dos cantidades que corresponden a dos partes o a dos conjuntos distintos. Según sean sus valores, el resultado puede ser mayor, menor o igual a la unidad. Algebraicamente, el ratio es una fracción que puede ser propia o impropia, según sean las cantidades que se comparen o relacionen. Supongamos, por ejemplo, que estoy interesado en conocer el ratio de los telespectadores de dos programas de televisión, CSI y House, que se emiten en distintos días. El ratio se obtendría dividiendo el número de telespectadores de ambos programas:
Ambas cifras de audiencia absoluta (número estimado de telespectadores) corresponden a cadenas distintas, de diferentes días, y, por tanto, no están relacionadas entre sí, pues pertenecen a grupos distintos.
1.3. Porcentajes Un porcentaje es una forma de expresar una fracción cuyo denominador es 100 y se indica con el símbolo %. Por ejemplo:
Es importante remarcar que el símbolo “%” significa que la cifra que lo acompaña está dividida por 100. Es un error común operar únicamente con dicha cifra sin tener en cuenta que, en realidad, es la centésima parte de ella. Para expresar una fracción en porcentajes, se multiplica por 100 y al resultado se le añade el símbolo %. Ejemplo:
© Editorial UOC
25
Capítulo I. Los porcentajes
2 2 en porcentajes = ⋅100 = 25% 8 8 El resultado puede interpretarse así: 2 es a 8 como 25 es a 100, o lo que es lo mismo, 2 es la cuarta parte de 8 (igual que 25 lo es de 100). En realidad, la conversión a porcentajes no es más que un cambio de referencia. A veces resulta más fácil o intuitivo plantearlo como una simple regla de tres (directa): 2 ............................
es a 8
x ............................
es a 100
De donde, Se ha hallado una cantidad, 25, que respecto a su total, 100, guarda la misma proporción que 2 a 8.
2. Operaciones básicas
Veamos con mayor detalle algunas aplicaciones simples y útiles del cálculo con porcentajes: • • •
Conversión de una cantidad en un porcentaje Cálculo del porcentaje de una cantidad Variaciones porcentuales - Cálculo del valor inicial, conocido el incremento porcentual y el valor final. - Cálculo del valor final, conocido el incremento porcentual y el valor inicial.
© Editorial UOC
26
Estadística para periodistas, publicitarios...
2.1. Conversión de una cantidad en un porcentaje Se trata de expresar una cantidad P, que representa una parte de un total T, en un porcentaje. Para ello necesito conocer dos cifras: la que voy a convertir en un porcentaje (P) y la que nos indica la cantidad total (T). Es el caso ya comentado anteriormente, y que puede resolverse con una simple regla de tres simple directa: P ............................ x T ............................ 100 de donde
Ejemplo En una determinada ciudad, de 42.000 habitantes, se estima que existen 3.000 lectores diarios de una publicación local. ¿Cuál es el porcentaje de lectores diarios? En este caso, P = 3.000 y T = 42.000. El porcentaje de lectores diarios será:
Si lo planteamos con una regla de tres: 3.000 (parte) ............................ 42.000 (todo) ............................
es a x (parte) es a 100 (todo)
O bien, 3.000 (parte) ............................ x (parte) ............................
es a 42.000 (todo) es a 100 (todo)
En ambos casos, aislando la incógnita, resulta el mismo valor:
© Editorial UOC
27
Capítulo I. Los porcentajes
x=
2.2. Cálculo del porcentaje de una cantidad
En este caso, pretendemos conocer a cuánto asciende el porcentaje de una cantidad, que llamaremos base o referencia (T). Por ejemplo, deseo conocer el 24% de 2.000 . Algebraicamente se trata de calcular 24 centésimas de 2.000 . Ello significa dividir la cantidad total (2.000 ) en centésimas y sumar 24 de ellas. Por tanto,
Si planteo una regla de tres: 24 (parte) ............................ 100 (todo) ............................
es a x (parte) es a 2000 (todo)
x=
Ejemplo De los 3.000 lectores del ejemplo anterior, un 20% son jóvenes entre 23 y 28 años. ¿Cuántos jóvenes, de dicha edad, son lectores? Según los planteamientos anteriores: jóvenes
Mediante la regla de tres: 20 ............................ como 100 ............................
es a x es a 3.000
© Editorial UOC
28
x=
Estadística para periodistas, publicitarios...
jóvenes
2.3. Variaciones porcentuales En la prensa económica y, en general, la relacionada con el mundo publicitario, es habitual el manejo de porcentajes y de incrementos o variaciones porcentuales. Por ejemplo:1
Los incrementos o decrementos de determinadas cantidades producidas en distintos periodos de tiempo, suelen expresarse en porcentajes. Si nos detenemos unos instantes en reflexionar acerca de su planteamiento, resulta muy sencillo deducir como se calculan. En general, intervienen tres variables: Vi = valor inicial Vf = valor final ∆=incremento en % Cuando una cantidad varía con el tiempo, y deseamos cuantificar de alguna manera su evolución en dos periodos determinados, hay dos opciones: •
De forma absoluta: mediante su diferencia algebraica.
1. Estudio Infoadex de la inversión publicitaria en España 2007
© Editorial UOC
•
29
Capítulo I. Los porcentajes
De forma relativa: expresando, la diferencia anterior con relación a su valor inicial. Dicho cociente, como ya hemos comentando anteriormente, puede multiplicarse por 100 y expresarse en porcentajes. Si el resultado es positivo, indicará un incremento (∆), o sea, una tendencia creciente. Por el contrario, si es negativo, se ha producido un decremento ( ) o bien, un incremento negativo (-∆). ∆
¿Cuál sería el incremento obtenido, en cantidades absolutas? Sencillamente, la diferencia algebraica entre ambas cantidades (final e inicial): (Vf - Vi) Si en vez de la diferencia en unidades absolutas, deseo calcular dicha diferencia en unidades relativas, el resultado anterior se divide por el valor inicial:
Si quiero expresar el resultado en porcentajes, hay que multiplicar por 100 y, no nos olvidemos, añadir el símbolo %:
Ejemplo ¿Qué variación se requiere para pasar de 5 a 15 ? En unidades absolutas, es la diferencia: 15€-5€ =10€. En unidades relativas, se divide dicha cantidad absoluta por la inicial (5€),
El incremento resulta igual a 2. Significa dos veces el valor inicial, o lo que es lo mismo, expresado en porcentajes,
© Editorial UOC
30
Estadística para periodistas, publicitarios...
∆ (%) =
El valor final se ha obtenido al incrementar un 200% el valor inicial. Comprobémoslo: •
Un 200% del valor inicial es igual a:
•
Si sumamos 10€ a los 5€ iniciales, efectivamente obtenemos los 15€ finales. Luego el cálculo es correcto.
2.3.1. Falsas interpretaciones Es fácil deducir que, por ejemplo, cuando se produce un incremento del 100% (incremento igual al valor inicial), la cantidad final es el doble de la inicial.
A veces, se confunde un valor doble final como un incremento del 200%. Para evitarlo conviene diferenciar entre el incremento y la relación entre la cantidad final respecto a la inicial. Recordar que el valor final se obtiene sumando al valor inicial el incremento que se produce sobre dicha cantidad. De forma similar, un incremento del 200% (es decir un aumento de una cantidad doble a la del valor inicial) añadido al valor inicial da lugar a una cantidad final que es el triple de la inicial. Ello no significa que se haya producido un incremento del 300%, sino que la cantidad final resultante es el triple de la inicial.
© Editorial UOC
31
Capítulo I. Los porcentajes
A veces, aunque se tenga claro el concepto, se utilizan términos inapropiados creándose confusiones y malentendidos.
2.3.2. Cálculo de los valores inicial y final Planteamiento general Tal como hemos comentado, si partimos de una cantidad o valor inicial y ésta resulta incrementada en un porcentaje (aplicación de un porcentaje a una cantidad), se obtiene el valor final. Podemos plantear que: valor inicial + variación producida sobre el valor inicial = valor final Algebraicamente, Vi + ∆ - Vi = Vf A partir de esta sencilla ecuación en la que intervienen tres variables (Vi, ∆, Vf ) puede obtenerse cualquiera de ellas, conociendo las restantes. Veamos las distintas posibilidades que tenemos: a) Se conoce el valor inicial y el final. El incremento será:
b) Se conoce el valor inicial y el incremento. El valor final será:
Vf = (Vi + ∆ ·Vi) c) Se conoce el valor final y el incremento. El valor inicial se obtiene:
Hay multitud de ocasiones en la práctica profesional (y también en la personal) en las que tendremos que operar con las anteriores fórmulas: conocer el presupuesto antes de IVA a partir del presupuesto global (con IVA), calcu-
© Editorial UOC
42
Estadística para periodistas, publicitarios...
9.- Los ingresos publicitarios de TVE en 1994 fueron de 75.100 millones de pesetas, y en 1.993 de 72.565 millones de pesetas. Calcular el incremento que se obtuvo en dicho periodo. Solución Datos iniciales Ingresos publicitarios en 1993: 72.565 millones de ptas. Ingresos publicitarios en 1994: 75.100 millones de ptas. Consideraciones • Conocidos los valores iniciales y finales se aplica la fórmula para calcular el incremento (en %). Resolución El incremento es:
El incremento producido es del 3,49 por ciento. Observaciones Si queremos estar seguros del resultado, podemos comprobarlo. Para ello aplicamos el incremento obtenido a la cantidad inicial y vemos si resulta la cantidad final:
Observamos que existe una diferencia entre el resultado comprobado y el proporcionado en el ejercicio. Dicha diferencia proviene del redondeo a dos decimales en el cálculo del incremento. Si en vez de dos decimales se utilizan cinco (3,49342%), resultaría:
© Editorial UOC
43
Capítulo I. Los porcentajes
10.- Según una noticia difundida por la prensa, la cadena de televisión Tele 5 ganó 12.107 millones de pesetas netos en 1998, que supuso un 34,5% más que en 1997. Calcular el beneficio obtenido en dicho año. Solución Datos iniciales Beneficio en 1998: 12.107 millones ptas. Incremento producido: 34,5% Consideraciones • Conocemos el valor final (beneficio en 1998), la variación experimentada (incremento del 34,5% ) y hay que calcular el valor inicial (beneficio en 1997). Utilizaremos la expresión algebraica para el cálculo del valor inicial. Resolución El valor inicial es:
El beneficio en el año 1997 fue de 9.001,5 millones de pesetas. Observaciones Si comprobamos el resultado, se obtiene:
En este caso, la cifra es bastante aproximada a la indicada, lo cual sugiere que el error de redondeo en el incremento, ha sido menor que en el caso anterior.
© Editorial UOC
44
Estadística para periodistas, publicitarios...
11.- En base a las mediciones efectuadas por Sofres, la cadena de televisión Antena 3 obtuvo, un determinado día, unas audiencias de 388.341 y 734.861 individuos a las 21:00 y 21:30 horas respectivamente. Calcular la variación relativa de audiencia en dicho periodo de tiempo. Solución Datos iniciales Audiencia estimada a las 21:00 = 388.341 individuos Audiencia estimada a las 21:30 = 734.861 individuos Consideraciones • Es un problema típico de cálculo de un incremento. Se procede de forma similar a los casos anteriores. Resolución El incremento es:
El incremento de audiencia fue del 89,24 por ciento.
© Editorial UOC
45
Capítulo I. Los porcentajes
12- A partir de la información del artículo El número de ricos se estanca pese al espectacular crecimiento de la economía4, y con relación al gráfico “Vivienda”, comprobar los siguientes resultados:
1. El incremento, en porcentaje, de la vivienda usada en el periodo 2003-04. 2. El precio medio a 31/XII de la vivienda nueva en el año 2003.
4. MAGALLÓN, E. La Vanguardia [Barcelona] (18 octubre 2006), Economía, p. 70.
© Editorial UOC
59
Capítulo I. Los porcentajes
3.- Con relación al artículo La Vanguardia aumenta su difusión y consolida su hegemonía en Cataluña,7 responder a las siguientes preguntas:
a) ¿Cuál fue el decremento de ventas de La Vanguardia en el periodo 19992000? b) En el año 2001 el promedio de difusión de La Vanguardia fue superior al conseguido por El Periódico. Calcular el incremento en porcentaje. 7. La Vanguardia [Barcelona] (9 junio 2002), Sociedad, p. 41.
© Editorial UOC
60
Estadística para periodistas, publicitarios...
c) Indicar si es correcta la conclusión obtenida a partir de lo expresado en el artículo: “...la variación experimentada por El País en el año 2001 con relación al 2000 fue de un -0,62% y la Razón de un 80,41%...” Conclusión: en promedio, la variación media de ambos periódicos fue de un 39,90%. 4.- En el año 1993, los tipos impositivos (IVA) de los hoteles disminuyeron del 15% al 6%, es decir, disminuyendo los precios un 9%. ¿Es correcta esta afirmación? 5.- ¿Qué te sugiere el siguiente titular? “La tasa de desempleo aumentó un 30%” 6.- En base a la información suministrada en el artículo Las adopciones internacionales aumentan un 40% en un solo año en España8 responder a las siguientes cuestiones:
a) ¿Cuál fue el incremento de adopciones en el periodo 2003-04?
8. Rodríguez de Paz, A. La Vanguardia [Barcelona] (29 abril 2005), Sociedad, p. 36.
© Editorial UOC
61
Capítulo I. Los porcentajes
b) ¿Cómo se denomina, algebraicamente, la relación “volumen de adopciones de Francia respecto a las de Italia”? 7.- A partir de los datos reflejados en el artículo La universidad se globaliza,9 contestar a las siguientes preguntas:
a) ¿Cómo se denomina la relación “total Erasmus Catalunya/Madrid”? b) ¿Cuántos estudiantes Erasmus llegaron a España en el curso 2004-05?
9. Gutiérrez, M. La Vanguardia [Barcelona] (15 mayo 2006), Sociedad, p. 31.
© Editorial UOC
62
Estadística para periodistas, publicitarios...
8.- Una vez leído y analizado el artículo Caffarel anuncia el fin de un ciclo en la memoria de RTVE,10 responde a las siguientes cuestiones:
a) ¿Cómo se denomina la relación “empleados fijos RTVE/contratados”? b) ¿Qué incremento porcentual de contratados se produjo en el periodo 2004-05?
10. Orta, J.M. La Vanguardia [Barcelona] (27 junio 2006), Vivir, p. 11.
© Editorial UOC
73
Capítulo II. Aplicaciones prácticas
Capítulo II Aplicaciones prácticas
“Nunca consideres el estudio como una obligación sino como una oportunidad para penetrar en el bello y maravilloso mundo del saber” (Albert Einstein)
En este capítulo se expondrán dos interesantes aplicaciones de los porcentajes. En primer lugar se tratará sobre el significado y cálculo de las audiencias de televisión, definiéndose los conceptos básicos de audiencia (rating), cuota de pantalla (share) y otros indicadores menos conocidos pero de gran utilidad bajo el punto de vista cuantitativo. A partir de sus expresiones algebraicas simplificadas se planteará la resolución de sencillos casos basados, la mayoría de ellos, en ejemplos reales a partir de los datos de audiencia procedentes de la audimetría.1 No es objetivo de este capítulo profundizar en este tema pues existe suficiente bibliografía especializada en el mismo.2 Se ha considerado que era una temática atractiva como ejemplo de aplicación de los porcentajes por su incidencia en los campos de la comunicación y publicidad. En segundo lugar, a partir de ejemplos comentados, se mostrará cómo se tabulan los diseños y/o resultados de encuestas (tablas horizontales, verticales, absolutas), su interpretación y la forma de operar con ellas.
1. La empresa responsable de la medición de la audiencia en España es Sofres Audiencia de Medios, que pertenece a la multinacional TNS (Taylor Nelson Sofres). 2. Aquellos lectores que quieran conocer con mayor profundidad determinados aspectos sobre la medición, sus fundamentos estadísticos, predicción de audiencias, etc. pueden consultar Jauset, J. (2000). La investigación de audiencias en televisión. Fundamentos estadísticos. Barcelona, Paidós.
© Editorial UOC
74
Estadística para periodistas, publicitarios...
1. Las audiencias de televisión
Las cifras de audiencia se han convertido en algo imprescindible y de suma importancia en los medios de comunicación. Conocer el nivel de audiencia que tiene cada uno de los espacios o programas de una cadena de televisión es fundamental ya que repercute directamente en su principal fuente de ingresos, es decir, en la venta de espacios o franjas de tiempo, cuya cotización varía proporcionalmente al nivel de audiencia. La televisión es el medio que más audiencia puede generar, dando buena fe de ello las cifras millonarias que anualmente se invierten en publicidad,3 aspecto muy valorado por los planificadores de medios para obtener los costes y rentabilidades de las campañas publicitarias. El principal objetivo de la medición de audiencia en televisión es conocer el número de individuos o personas que consumen sus productos. Interesa quién, durante cuánto tiempo, cuándo y qué ve. De poco sirve saber que un determinado programa tiene dos millones de telespectadores si no conocemos sus características (edad, aficiones, formación, profesiones, etc.). Es interesante, pues, que los estudios de audiencia indiquen o den a conocer no solo aspectos cuantitativos sino también cualitativos.4
1.1. La medición de la audiencia El principal sistema de medición de las audiencias televisivas en nuestro país es la audimetría. Por ello es interesante conocer como se define o qué entiende por audiencia dicho sistema de medición.5 Veamos: Un audímetro, dispositivo electrónico diseñado para “medir” la audiencia de televisión, contabiliza un individuo como “audiencia” cuando es detectado durante varios
3. Alrededor de 3.000 millones de euros en los últimos años (Estudio Infoadex de la inversión publicitaria en España 2007). 4. Existen interesantes obras dedicadas a los aspectos cualitativos. Pueden consultarse, por ejemplo, Callejo, J. (2001) Investigar las audiencias. Barcelona, Paidós y Huertas, A. (2002), La audiencia investigada. Barcelona, Gedisa. 5. Otro importante estudio de referencia y que sirve como contraste externo es el Estudio General de Medios (EGM), que anualmente lleva a cabo la Asociación para la Investigación de los Medios de Comunicación (AIMC). A diferencia de la audimetría, que utiliza dispositivos electrónicos, el EGM se basa en entrevistas personales.
© Editorial UOC
75
Capítulo II. Aplicaciones prácticas
segundos consecutivos después de identificarse (a través de un mando a distancia). Ello exige que el usuario o panelista “contacte” con el medio un tiempo mínimo, denominado tiempo de persistencia, por debajo del cual es ignorado. Este tiempo mínimo no está estandarizado y varía de unos países a otros. Desde 1 segundo (Francia, Alemania), 5 segundos (España, Portugal) 15 segundos (Reino Unido, Bélgica, Dinamarca, Grecia), 30 segundos (Suecia, Austria), hasta incluso varios minutos.6
En cualquier caso, aunque el audímetro es un equipo diseñado para registrar información segundo a segundo, se toma como unidad de referencia el minuto. Es decir, a partir de los resultados o datos obtenidos durante los registros de un minuto se asignará una determinada cantidad de audiencia a una u otra cadena. ¿Mediante qué criterio? Existen diversas opciones: 1. Se asigna como espacio o canal sintonizado aquél que, dentro del minuto, haya sido seleccionado durante más segundos. En el caso de que coincidan en tiempo dos espacios o canales, se asigna a la última cadena sintonizada por primera vez dentro del minuto. Si durante ese minuto, la mayor parte del tiempo el receptor se ha apagado, no se efectúa ninguna asignación. Esta es, actualmente, la regla vigente en España. 2. Un individuo se contabiliza como audiencia en un determinado minuto si mantiene su identificación la mayor parte de él, es decir, durante 31 o más segundos. Si exactamente ha sido durante 30 segundos, el primer periodo de 30 segundos determina el estado para todo el minuto.7 Estos son los criterios necesarios para que un individuo sea considerado como audiencia. Pero, ¿es suficiente? ¿Qué ocurre con la actitud del usuario? Los índices de audiencia ¿cuantifican quiénes se han identificado, independientemente de su comportamiento o su actitud frente al espacio o programa televisivo?8 Por ejemplo, el usuario o panelista: •
¿Debe estar simplemente en la habitación donde está situado el televisor sin importar que esté o no prestándole atención?
6. Rubio, R. Ponencia presentada en al Vl Seminario de audiencia de televisión. AEDEMO, 1990. 7. Este criterio se había utilizado con anterioridad en España. 8. Es un aspecto que varía también según los países. En el Reino Unido, un panelista debe identificarse por el mero hecho de encontrarse en la habitación en la que esté el televisor encendido independientemente de si está atento o no. En otros países, como Austria, se requiere una actitud más activa.
© Editorial UOC
76
Estadística para periodistas, publicitarios...
•
¿Tiene que estar sentado en el sofá viendo activamente y con atención el programa que se emite?
•
Cada vez que se ausenta de la habitación donde está el televisor, aunque sea poco tiempo ¿debe comunicarlo al audímetro?
Los índices de audiencia cuantifican quiénes se han identificado, independientemente de su comportamiento o su actitud frente al espacio o programa televisivo. Este es, precisamente, uno de los puntos débiles del sistema y el más criticado por sus adversores. Cada país establece o define sus propios criterios bajo los cuales se lleva a cabo la medición por el sistema de audimetría. Son criterios consensuados por los diferentes estamentos y por ello no es posible la comparación de datos de audiencia de distintos países. Los conceptos de universo, audiencia y el tratamiento estadístico del período vacacional de los panelistas son algunos de ellos: •
Definición de universo: las divergencias surgen al considerar la edad mínima de los niños y/o en la edad mínima de los adultos. Las edades barajadas oscilan entre los 3 y 6 años, en el caso de niños y de 14 a 16 años en el caso de adultos.
•
Definición de audiencia: para que un individuo deba identificarse como tal existen varios criterios. En algunos países es suficiente estar presente en la habitación donde está el televisor (por ejemplo en Dinamarca, Francia, Reino Unido). En otros, el panelista debe ser capaz, además, de poder ver la televisión (Finlandia).9 Finalmente hay países que consideran que ver la televisión es, además de lo anterior, prestarle atención (Austria, Italia, España).
•
Tratamiento de las vacaciones: algunos países excluyen los hogares del panel cuando sus ocupantes están de vacaciones o de fin de semana (España, Turquía, Portugal). José Ignacio Wert, cuando era responsable del Centro de Investigaciones Sociológicas, declaraba que:
“...se consideran hogares sin actividad, de audiencia cero, que sin embargo ve la televisión en otro sitio. En el reparto de audiencia de esos días hay menos de la real... Es un compromiso aceptable entre exactitud y riesgo...”
9. Se refiere a una situación o posición física, no a una actitud o predisposición psíquica.
© Editorial UOC
77
Capítulo II. Aplicaciones prácticas
Es evidente que en un futuro inmediato, y debido a los nuevos medios que la tecnología pone a disposición de los usuarios, la medición de la audiencia tendrá que rediseñarse para poder “contabilizar” con mayor fiabilidad a todos aquellos usuarios que con el sistema actual no se contemplan pero que también consumen televisión. Hoy día, por ejemplo, no se consideran los emplazamientos públicos (residencias de la tercera edad, hospitales, bares, segundas residencias, centros de fitness,…) y tampoco aquellos usuarios que consumen televisión por Internet (televisión IP). En la muestra actual equipada con audímetros no se contemplan las variables anteriores, seguramente por su dificultad técnica. Dada la diversidad de plataformas tecnológicas que configuran los escenarios presentes y futuros a corto plazo, será necesario disponer de audímetros personales o de nuevos sistemas que aporten la calidad necesaria al sistema de medición de audiencias. Solamente así se reducirán las críticas al sistema actual que genera tanta controversia y debate en torno a su fiabilidad.
1.2. Definiciones
1.2.1. Audiencia La audiencia como magnitud absoluta, y en el caso particular de la televisión, puede definirse como el conjunto de individuos que mantiene contacto con dicho medio a través de un programa o espacio publicitario y durante un periodo de tiempo determinado. Puede referirse a una cadena, a un programa o a la audiencia del conjunto de todas las cadenas (audiencia total, TTV). Es una magnitud que varia segundo a segundo, está referenciada al minuto (por convenio establecido entre las diversas partes interesadas) y a menudo está promediada con el tiempo.10 La audiencia puede darse en magnitudes absolutas (en miles de telespectadores, indicándose con tres ceros, 000) o en magnitudes relativas (porcentajes). 10. Es importante, por ello, conocer la referencia temporal del indicador de audiencia que se cite.
© Editorial UOC
78
Estadística para periodistas, publicitarios...
En base a determinados criterios, pueden definirse distintas clases de audiencia. Por ejemplo, las audiencias potencial, objetivo, útil, bruta, neta, acumulada, máxima, mínima, total y media.
1.2.2. Rating Expresa la audiencia en términos relativos, con relación a un universo o población. Es, en general, el porcentaje estimado de personas que consumen un espacio de televisión.
Rating (%) =
audiencia absoluta ⋅100 universo
El universo es el definido como tal en audimetría,11 o el relativo al target que se considere (niños, jóvenes, adultos, amas de casa, entre otros). Si se desea conocer la audiencia absoluta, a partir de la relativa (el universo siempre es un dato conocido) es fácil calcularla por una simple multiplicación: Audiencia absoluta (000) = rating (%) x universo (000)
Existen diferentes definiciones de rating relacionadas con las distintos tipos de audiencias. El rating puede referirse a un instante, a una franja horaria (cinco minutos, un cuarto de hora,...) o a un espacio publicitario. Lo más habitual es utilizar la audiencia del minuto medio, es decir, la audiencia media, como numerador de la fracción anterior. Si éste es el caso, el rating asociado sería:
Rating (%) =
audiencia media (000) ⋅100 universo
En este caso, el rating equivale al porcentaje medio de individuos que ve un determinado espacio teniendo en cuenta las distintas duraciones y expresados con relación al universo que pertenecen. 11. En España corresponde a todos los individuos de 4 y más años de edad. Anualmente se consideran las cifras que ofrece el Instituto Nacional de Estadística, en base a los censos sobre los padrones de habitantes de la población.
© Editorial UOC
79
Capítulo II. Aplicaciones prácticas
Observaciones: •
En los rating el numerador siempre debe ser una parte del denominador (cantidad global) para que tenga sentido el porcentaje (no confundir con ratios). Ambas cantidades deben tener la misma unidad de medida para que el cociente pueda expresarse en porcentajes.
•
Dado que existen distintas definiciones de rating es fundamental conocer la referencia para su correcta interpretación.12
1.2.3. Audiencia media Es el término más utilizado para indicar la audiencia de un determinado programa o espacio televisivo. La audiencia media puede definirse como el número de individuos que mantienen contacto con el medio televisivo durante un periodo de tiempo, teniendo en cuenta dicha duración y contabilizando las repeticiones que existan en cada uno de los minutos. Por tanto: – Equivale al número medio de telespectadores por minuto del programa, pues es el cociente entre el número total estimado de telespectadores de dicho programa a lo largo de un periodo de tiempo y la duración del mismo.
Audiencia media ( 000) =
∑ telespectadores (000) ⋅ minutos
duración total del espacio en minutos
Otra forma de calcular la audiencia media es teniendo en cuenta los minutos consumidos de televisión. Así, en vez de contabilizar los telespectadores que ven un determinado canal o programa cada minuto, se tienen en cuenta, en cada uno de los minutos, los consumidos relativos a un determinado canal o programa.
12. En los informes de audiencias, a veces, la audiencia total (TTV) aparece expresada en unidades relativas (porcentajes) en vez de absolutas (individuos). En este caso, los miles de individuos que ven cualquier cadena de televisión dividido por el universo de referencia según se ha definido en el texto, también sería un rating. Sin embargo, suele reservarse dicho término para la audiencia media expresada en porcentaje.
© Editorial UOC
95
Capítulo II. Aplicaciones prácticas
6.- Una cadena de televisión ha obtenido una audiencia media del 0,4% en un programa de 81 minutos de duración. Sabiendo que la audiencia media del día fue del 4,66%, calcular la aportación a la cadena del citado programa Datos iniciales Audiencia media: 0,4% Duración del programa: 81 minutos Audiencia media del día de la cadena: 4,66% Consideraciones • Mediante el índice de aportación a la cadena, se valora y cuantifica la contribución del programa a la audiencia media de todo el día. Resolución El índice de aportación a la cadena (IAC) es:
IAC (%) =
duración del programa ' ⋅ audiencia media del programa ⋅100 minutos día ⋅ audiencia media de la cadena del dia
Sustituyendo,
IAC (%) =
81'⋅0,4% ⋅ 100 = 0,48% 24 ⋅ 60'⋅4,66%
El programa contribuye con un 0,48 por ciento a la audiencia media del día de la cadena. Observaciones Mediante este indicador es fácil conocer cuáles son los programas que más contribuyen a la audiencia media diaria de la cadena.
© Editorial UOC
96
Estadística para periodistas, publicitarios...
7.- Supongamos que una cadena de televisión, en el mes de octubre, tiene un share medio del 24%. Sus programas estrella, emitidos en franjas distintas, han obtenido los siguientes share: Programa A: 26%; Programa B: 32%; Programa C: 22%; Programa D: 23%. ¿Cuáles han sido más beneficiosos para la cadena? Datos iniciales Share de los distintos programas: 26%, 32%, 22%, 23% Consideraciones • Procederemos a calcular el Índice de Aprovechamiento Genérico que compara los distintos share con el share medio de la cadena. Resolución
IAG (%) = IAGA = IAGC =
share programa (%)
share medio cadena (%)
26% ⋅100 = 108,33% 24% 22% ⋅100 = 91,67% 24%
⋅100
IAGB =
32% ⋅ 100 = 133,33% 24%
IAGD =
23% ⋅100 = 95,83% 24%
Los programas más beneficiosos para la cadena han sido el A y el B. Observaciones Una simple observación bastaría para ver que los programas que han beneficiado a la cadena son aquellos cuyo share es superior al share medio. Es el caso de los programas A y B tal como resulta al calcular el IAG, superando el 100%.
© Editorial UOC
121
Capítulo III. Los estudios en muestras
Capítulo III Los estudios en muestras. Fundamentos
“Si a la primera no aciertas, eres del promedio” (Anónimo)
En la vida real se presentan multitud de ocasiones en las que podemos estar interesados en analizar una o varias características, cuantificables o no, de un determinado y amplio colectivo (personas, animales, cosas) denominado universo o población. Cuando por razones de recursos disponibles, ya sean temporales o económicos, no es posible efectuar el análisis a todos y cada uno de los elementos que lo integran, se recurre al estudio de una pequeña parte o subconjunto, denominado muestra. Pensemos, por ejemplo, en una editorial que quiere cambiar el diseño de la portada de su publicación favorita. Es una decisión importante, que afectará directamente a las ventas y, por tanto, muy arriesgada. Es necesario conocer la opinión de los consumidores, de sus lectores, para valorar si es conveniente el cambio de diseño. Sin embargo, desconocemos quienes son los lectores (exceptuando a los suscriptores) y no es posible conocer la opinión de todos ellos. A nivel político, por ejemplo, se requieren una serie de indicadores que aporten información de los ciudadanos sobre la gestión del gobierno. En función de los resultados podrán tomarse las decisiones adecuadas para corregir o mejorar las actuaciones previstas. Citemos, en este caso, las encuestas periódicas del Centro de Investigaciones Sociológicas (CIS) acerca de los hábitos, intereses, opiniones en general de los españoles, obtenidos a partir del análisis en pequeños colectivos o muestras convenientemente seleccionadas. Sería utópico pensar que dichos estudios deberían efectuarse a todos y cada uno de los españoles, teniendo en cuenta el tiempo y el coste económico que supondría.
© Editorial UOC
122
Estadística para periodistas, publicitarios...
En este capítulo trataremos sobre los aspectos más básicos del muestreo, sus fundamentos y principales características, sin profundizar en los aspectos matemáticos, pero aportando las ideas necesarias para su comprensión.
1. Estudios de investigación. Planificación
En general, antes de realizar un estudio de investigación, deben plantearse una serie de cuestiones y seguir una metodología que sea eficaz para llevar a cabo los objetivos previstos. La planificación de un estudio científico, de un estudio de investigación, puede estructurarse, sintéticamente, en las siguientes fases o etapas: 1. Diseño 2. Recogida de datos 3. Obtención de resultados 4. Interpretación: análisis y conclusiones Diseño Es la fase de definición y planificación general del estudio. Entre otros aspectos, hay que considerar: •
El objetivo del estudio y las características objeto de interés (estudio de variables o atributos).
•
Si se trabajará sobre el universo o en una parte del mismo (muestra)
•
La técnica o método de selección más adecuado
•
El tamaño o el error muestral admitido en el estudio y su grado de confianza (si se decide trabajar con muestras).
© Editorial UOC
123
Capítulo III. Los estudios en muestras
•
El coste económico del estudio
•
El calendario o timing de cada una de las fases del estudio y la asignación de los recursos económicos y humanos.
Recogida de datos Es la ejecución propia del trabajo de campo. La recogida de datos puede ser: •
Directa: la información es ofrecida por el individuo en cuestión (entrevistas personales, cara a cara, telefónicamente, por correo postal y/o electrónico).
•
Indirecta: se recurre a información ya elaborada en anteriores ocasiones (bases de datos, anuarios, informes, …)
Obtención de resultados Es la fase de proceso o cálculo de los resultados. Se efectúa utilizando programas especiales,1 o bien, si la complejidad es menor, mediante las utilidades de las hojas de cálculo (por ejemplo Excel). Interpretación: análisis y conclusiones A partir de los resultados, se analizan y se extraen las conclusiones finales con el objetivo de asesorar al cliente (si se trata de un encargo) y/o tomar las decisiones pertinentes. Estas son las fases, esquemáticas, que comprende cualquier estudio de investigación. En la fase de diseño se contempla, entre otros, la conveniencia de trabajar con una muestra. Veamos a continuación en qué consiste el muestreo y sus aspectos básicos más importantes.
1. Una de las aplicaciones informáticas más utilizadas es el Statistical Package for the Social Sciences (SPSS), aunque existen muchas aplicaciones diseñadas a medida.
© Editorial UOC
124
Estadística para periodistas, publicitarios...
2. El muestreo
Muestrear consiste en seleccionar aquellos elementos del universo que van a constituir la muestra en la que se realizará el estudio en particular. Así, de un universo, cuya población es N, se elige una representación o muestra de n elementos. Cuando se trabaja con muestras, el objetivo deseado es estimar el resultado que se obtendría si fuera posible realizar el análisis a todo el universo, únicamente con los resultados alcanzados en la muestra.2 Para que esto sea posible, deben cumplirse ciertos requerimientos en la selección de la muestra: ésta debe elegirse al azar (técnicas aleatorias)3 y además, tiene que ser representativa del universo o colectivo del que procede, o sea, con características similares.4 En los casos en que no sea así, los resultados obtenidos solamente serán válidos para la muestra en particular pero no podrán proyectarse o inferirse al universo de interés. Recordemos que a partir de los resultados de las encuestas los empresarios, gerentes, directivos, políticos, y todos aquellos que sean responsables de un proyecto estratégico, toman importantes decisiones que pueden afectar, a futuros resultados económicos y/o sociales. De ahí la importancia de que dichos estudios sean efectuados mediante aquellas técnicas que aporten la calidad y fiabilidad suficiente en las proyecciones de sus resultados. Cuando la muestra cumple las condiciones citadas anteriormente es posible evaluar matemáticamente el error que se producirá por el propio proceso (error muestral) y la estimación final irá acompañada de un grado 2. Según cita Punset (2006, 263) en su libro El alma está en el cerebro, aludiendo a una frase de John Allen Paulos (profesor de matemáticas en la Temple University de Filadelfia, EE.UU): “En realidad, siempre es más fácil hacer predicciones sobre un grupo que sobre una persona individual. Si se estudian muchos objetos o grupos de personas, se puede llegar a ciertas conclusiones generales…” 3.
Las técnicas aleatorias utilizan los muestreos simple, sistemático, estratificado y de conglomerados. Cada uno tiene sus propias características y, en función del estudio en particular, interesará más uno u otro. Los analizaremos en el próximo capítulo.
4. Una muestra “equilibrada” significa que es representativa del universo del cual procede. Una muestra “sesgada” es aquella que no es representativa y/o no está bien seleccionada probabilísticamente. Uno de los ejemplos históricos que se cita en los libros de estadística, hace referencia a los resultados de los sondeos preelectorales para la presidencia de los EE.UU, en el año 1935, elaborados por Gallup y Literary Digest (Jauset, 2000:30).
© Editorial UOC
125
Capítulo III. Los estudios en muestras
de confianza o de cierta seguridad de la predicción efectuada. Ambos conceptos, muy importantes en la teoría de muestras, se definirán con detalle más adelante.
2.1. Muestras o universos Las ventajas de trabajar con muestras son evidentes: menor coste economicoy mayor rapidez. Es más barato entrevistar a 2.000 personas que a 70.000. Sin embargo, los resultados son estimativos, incluyen un posible error y van acompañados por una confianza de ocurrencia, con lo cual nunca podremos estar totalmente seguros de cuál hubiera sido el resultado si se hubiera analizado a todo el colectivo (universo). Este es, precisamente, el precio o peaje que hay que pagar por trabajar con muestras. Es un proceso cómodo, económico, pero los resultados incluyen una determinada probabilidad de ocurrencia. A pesar de las ventajas e inconvenientes citados, hay situaciones en las que no es posible trabajar con muestras, en particular por aspectos legales. Es el caso de las elecciones de los representantes políticos en el Parlamento, o de la elaboración del padrón de los habitantes de un estado o nación. En aquellos casos en que el colectivo de interés sea reducido, una vez valorado el coste económico podría plantearse un estudio poblacional (censal, a todo el universo) en vez de muestral. Sin embargo, hay ocasiones en que, forzosamente, debe utilizarse una muestra. Son aquellos casos en que la característica objeto de estudio o análisis es destructiva. Por ejemplo, imaginemos que una pequeña empresa fabrica bombillas y debe estimarse cuál es el tiempo medio de vida útil. Para efectuar dicha prueba, hay que mantener las bombillas encendidas hasta que se funde el filamento, por agotamiento. Es evidente que no puede realizarse esta prueba con todas las bombillas fabricadas pues el negocio sería ruinoso ¡¡¡no quedarían unidades para vender!!!
2.2. Tamaño de la muestra En general, un tamaño mayor implica más fiabilidad en los resultados. El tamaño ideal debería ser el del universo, pero entonces el estudio dejaría de ser muestral para ser poblacional, sin las ventajas citadas en cuanto a la dis-
© Editorial UOC
126
Estadística para periodistas, publicitarios...
minución de los costes. Más adelante se comentará, con detalle, la relación algebraica que existe entre el tamaño de la muestra y el error muestral. Los tamaños más habituales de las muestras oscilan entre 1.000 y 3.000 individuos.5 Algunos de los factores determinantes son el coste económico o presupuesto disponible, así como la fiabilidad deseada en los resultados. Cuando el tamaño de la muestra es muy pequeño, en comparación con el del universo, por ejemplo inferior al 5% (n< 0,05N), se dice que la población es infinita y si es superior, finita. En realidad, cuando el tamaño de la muestra está por debajo de un porcentaje tan pequeño como el 5% del total del universo, se considera que a efectos comparativos el universo es excesivamente grande (teóricamente infinito). Si el tamaño de la muestra es algo superior a ese porcentaje, entonces se trata como un universo finito. Esta diferenciación tiene que ver con la aplicación algebraica de una serie de fórmulas matemáticas para calcular los errores y tamaños muestrales y seleccionar, en un caso u otro, entre las fórmulas completas (tamaños finitos) o simplificadas (tamaños infinitos).
3. Definiciones
Las siguientes definiciones hacen referencia a los conceptos básicos de universo, muestra y las relaciones cuantitativas que se derivan de ellas.
3.1. Universo Es el conjunto de unidades o elementos, objeto de estudio o investigación, de los que se desea obtenerse cierta información. Su tamaño se indica por la letra N. Según tenga más o menos de 100.000 elementos se dice que su tamaño es infinito o finito. También se le conoce como “población”. 5. Excepto para determinados casos como el Estudio General de Medios cuyo tamaño supera los 40.000 individuos o la propia muestra de audimetría, para estimar las audiencias de televisión, con un tamaño entre 10.000-11.000 individuos.
© Editorial UOC
127
Capítulo III. Los estudios en muestras
El universo o población viene determinado según los objetivos y problema principal de la investigación. Por ello, los elementos objeto de análisis pueden ser individuos, familias, revistas, coches, medios de comunicació: lectores, marcas, telespectadores, consumidores, etc.. En cada caso el universo es distinto y es importante definirlo especificando quiénes son sus elementos así como sus características. El estudio de una o varias características de todos y cada uno de los elementos de un universo se conoce como censo. Un ejemplo típico es el estudio demográfico de los habitantes de un municipio (censo o padrón). Aquellos indicadores (por ejemplo el valor medio o la desviación típica) obtenidos a partir del estudio en un universo se denominan, en general, parámetros. Por tanto, cuando se habla de parámetros, implícitamente se relaciona con los resultados obtenidos en el estudio de un determinado universo.
3.2. Marco de muestreo Una vez se ha definido el universo, hay que especificar cuál es el marco de muestreo y a partir de él se diseña la muestra. El marco de muestreo es, de hecho, el universo práctico, es decir, el soporte que se utilizará para seleccionar la muestra. Cuando se habla de universo, como conjunto total de unidades de las que se desea información, es un universo objetivo y corresponde a un modelo ideal. En la práctica, la muestra se selecciona a partir de un medio físico o soporte (directorio, archivo, etc.) denominado marco de muestreo que coincide en menor o mayor grado con el universo objetivo. Figura 3.1 Relación entre el universo y el marco de muestreo
universo
marco de muestreo
© Editorial UOC
128
Estadística para periodistas, publicitarios...
Ejemplo Supongamos que se desea efectuar una encuesta a los jóvenes entre 16 y 25 años de la ciudad de Barcelona. Para seleccionar la muestra debe conocerse quién forma parte del universo definido. Para ello, podrían utilizarse los datos que constan en los registros oficiales (por ejemplo del Ayuntamiento o del Instituto Nacional de Estadística) y, a partir de esa información seleccionar la muestra. En términos estrictos, la muestra seleccionada solo será representativa de la población comprendida en el marco de muestreo elegido, y no del universo teórico. Ejemplo Cuando se utiliza la guía telefónica como soporte para seleccionar a los componentes de la muestra, se limita el universo a todas aquellas personas que tienen un número de teléfono registrado. Hay quién no desea que aparezca su número telefónico o incluso aquellas que tienen varios, pero sólo aparece listado uno de ellos. Ejemplo Imaginemos que hay que llevar a cabo un estudio, en una determinada ciudad, sobre la opinión de los periodistas acerca de su actividad profesional. En este caso podríamos obtener la muestra a partir del listado que nos facilite el colegio de periodistas de la ciudad en cuestión. Ése sería el marco de muestreo. Por tanto, la opinión recogida en el estudio sólo representaría a éstos y no a todos los periodistas (pues no todos los que ejercen son periodistas colegiados).
3.3. Muestra Es un subconjunto del universo, es decir, una pequeña parte del mismo. Su tamaño se representa por la letra n. Como ya se ha citado, para que los resultados de su análisis puedan inferirse o proyectarse para el conjunto de la población que constituye el universo de referencia, la muestra debe estar correctamente seleccionada (por téc-
© Editorial UOC
137
Capítulo III. Los estudios en muestras
2.- ¿Cuál de las siguientes afirmaciones es correcta? a) El universo y el marco de muestreo siempre coinciden b) Los resultados obtenidos del estudio en una muestra se generalizan como válidos (con un error y grado de confianza) para todo el universo. c) Aunque la práctica habitual es la anterior, estrictamente, los resultados son válidos (con un error y grado de confianza) para el marco de muestreo y no para el universo definido. d) Ninguna es correcta. 3.- Se efectúa una encuesta y un 45% de los encuestados están de acuerdo con la ley que se está tramitando al Parlamento. Esta cifra ¿es un parámetro o un estadístico?
4.- Elijo una muestra de 250 personas a partir de una población de 10.000 personas. Efectúo una operación matemática y obtengo 2,5%. El resultado corresponde a: a) La fracción de muestreo b) El coeficiente de elevación c) El error muestral d) El error estadístico 5.- Si la fracción de muestreo es 0,5 ¿Cuánto vale el coeficiente de elevación? a) 5 b)
2 0,5
c) 10 d) 2
© Editorial UOC
138
Estadística para periodistas, publicitarios...
6.- Un coeficiente de elevación con valor 75 significa que: a) Cada elemento de la muestra equivale a 75 elementos del universo b) La fracción de muestreo es 0,01333 c) La muestra es un 1,333% del tamaño del universo d) Todas son correctas Soluciones 1.- a) No. En realidad no sería una muestra ya que se ha considerado a todo el universo. b) No. Aunque no se indica como se ha efectuado la elección parece que no ha sido al azar. Por otra parte, difícilmente, un solo elemento puede representar a todo un universo. c) No. Como el perfume va dirigido a ambos sexos, debería recogerse la opinión tanto de hombres como de mujeres. d) No. Habría que efectuar una selección aleatoria entre las distintas floristerías de la ciudad y no elegir únicamente una, aunque sea céntrica. Por otra parte, no bastaría con observar cuantos hombres compran flores pues se desea conocer si son para regalar y no únicamente cuantos hombres compran flores. e) No. La muestra no es representativa en cuanto al sexo y edades de todos los que son socios del Barça. 2.- La respuesta correcta es la c. La definición de universo suele corresponder a un universo teórico y el marco de muestreo es la referencia a partir de la cual se obtiene la muestra. Sin embargo, habitualmente se considera que el universo definido es el mismo que el marco de muestreo y, en la práctica, no suele diferenciarse. 3.- Es un estadístico ya que es el resultado de una muestra. 4.- La fracción de muestreo (250/10.000 = 0,025 = 2,5%). 5.- La respuesta correcta es la d. El inverso de 0,5 (1/0,5) es 2. 6.- Todas son afirmaciones ciertas. Por tanto, la respuesta correcta es la d.
© Editorial UOC
139
Capítulo IV. Métodos de selección de muestras
Capítulo IV Métodos de selección de muestras
“Las Matemáticas pueden ser definidas como aquel tema en el cual ni sabemos nunca lo que decimos ni si lo que decimos es verdadero” (Bertrand Russell)
Una vez se conoce cuál es el tamaño más adecuado de la muestra, en base a los planteamientos y consideraciones del estudio a realizar, deben seleccionarse los distintos componentes que formarán parte de ella. Para ello existen distintos métodos en función de los cuales será posible proyectar los resultados de la muestra al universo de referencia, o bien, únicamente serán válidos para la muestra en particular. Aunque no se pretende exponer una descripción detallada de cada uno de los procedimientos de selección, puesto que ya existe bibliografía abundante al respecto,1 se mencionarán las características principales de cada uno de ellos, junto con aquellas observaciones que se consideran más interesantes. Finalmente, una vez seleccionados los integrantes de la muestra se inicia el trabajo de campo. En este aspecto es fundamental la actitud y formación del entrevistador para que en ningún caso pueda inducirse una u otra respuesta en el entrevistado, desvirtuando o disminuyendo la fiabilidad final del resultado.2 Supondremos que todo este procedimiento se lleva a cabo correctamente y, en este capítulo, nos centraremos en todos los requerimientos necesarios para elegir adecuadamente a todos los integrantes de la muestra.
1. Por ejemplo Cea d'Ancona (1998:179-202) y/o Rodríguez (1991). 2. Aunque no se cite expresamente, es obvio la importancia que tiene, en todo el proceso, el diseño del cuestionario (estructura, tipo de preguntas, cómo se formulan, la relación entre ellas, etc.)
© Editorial UOC
140
Estadística para periodistas, publicitarios...
1. Métodos de muestreo
En general, la elección de una muestra puede ser o no al azar. Esta circunstancia es básica para determinar si los resultados del estudio podrán o no proyectarse para todo el universo del que forma parte la muestra. Veamos cuáles son las características más destacables de los métodos clasificados como probabilísticos y no probabilísticos.
1.1. Métodos probabilísticos Los métodos probabilísticos, cumplen con los siguientes requerimientos: •
La elección de los elementos es al azar (aleatoria).
•
Todos los componentes del universo tienen probabilidad (conocida y no nula) de ser elegidos.
•
Es posible estimar matemáticamente el error muestral cometido, según demuestra el Teorema del Límite Central.3
•
Sus resultados pueden inferirse al universo o población, con una determinada probabilidad y error muestral. Son estimaciones acerca de los resultados que se obtendrían si se analizaran todos los elementos del universo.4
•
Su coste económico es superior a los no probabilísticos.
3. Este teorema es uno de los fundamentos de la estadística inferencial. Establece que, en muchos casos reales, cuando la muestra aleatoria es suficientemente grande (a partir de 30 elementos) la distribución de determinados estadísticos (medias, proporciones, varianza,…) es de tipo normal. Ello permite plantear afirmaciones acerca de la posibilidad de ocurrencia de dichos estadísticos cuando se extraen muestras de un universo con un valor medio y desviación típica conocidos. Puede aplicarse esta situación al caso en que se ignore el valor medio de una determinada variable del universo: se extrae una muestra, se calcula el valor medio de dicha variable en la muestra y se proyecta o estima su valor para todo el universo en base al resultado obtenido en ella. Lo mismo ocurre, de forma similar, con el estudio de proporciones (atributos). 4. No deja de ser curioso que sea precisamente el azar lo que permita efectuar predicciones.
© Editorial UOC
•
141
Capítulo IV. Métodos de selección de muestras
Ejemplos: métodos simple, sistemático, estratificado y conglomerados.
En la práctica, es muy difícil cumplir con todos los requisitos para que un método sea 100% probabilístico. Quizás el primer problema es que el universo y el marco de muestreo son distintos, no coinciden y, aún así, los datos de los censos (habitantes, guías telefónicas) tienen sus propias limitaciones. Otros problemas son las no-respuestas y los sesgos de respuesta que pueden producirse debido al comportamiento de los encuestados o del propio entrevistador. Por otra parte, también en la vida real y exceptuando algunos casos puntuales, los procedimientos aplicados son una combinación de las teóricos e incluso se mezclan, a su vez, con procedimientos no probabilísticos.
1.2. Métodos no probabilísticos Estos métodos se caracterizan por no cumplir con las condiciones citadas anteriormente. Es decir: •
La elección de los elementos no es al azar, sino de forma cómoda y/o a juicio del propio investigador o entrevistador.
•
Las muestras obtenidas son sesgadas y no es posible estimar el error muestral.
•
Sus resultados no pueden extrapolarse al universo o población.
•
Su única ventaja es que su coste económico es inferior al de los métodos probabilísticos.
•
Ejemplos: opinático, de cuotas, bola de nieve, accidental (incidental)
Algunos autores incluyen una tercera categoría (métodos semiprobabilísticos) contemplando aquellos procedimientos que, aún considerándose en parte probabilísticos, no lo son en su totalidad. Por ejemplo, el de rutas aleatorias”que comentaremos más adelante.
© Editorial UOC
142
Estadística para periodistas, publicitarios...
2. Muestreo probabilístico
A continuación se citan las características más comunes de los procedimientos aleatorios que se utilizan en los métodos probabilísticos siguientes: • • • •
Simple Sistemático Estratificado Conglomerados
2.1. Muestreo aleatorio simple En primer lugar, y antes de aplicar cualquier método de selección, debe conocerse cuál es el tamaño necesario de la muestra, aspecto que se ha considerado en la fase de diseño. Las características más destacables de este método son las siguientes: •
Se necesita un listado ordenado del primero al último elemento. Por tanto, es necesario conocer a todos y cada uno de los elementos que forman parte del universo o población.
•
Los componentes de la muestra se seleccionan mediante las tablas de números aleatorios, en cualquiera de sus variantes (papel, software, calculadora).5 Antiguamente se utilizaban dispositivos mecánicos (bombos).
•
Todos los elementos tienen la misma probabilidad de ser elegidos (distinta o igual, según sea con o sin reemplazo).
•
Este método es útil cuando la población es homogénea respecto a la característica objeto de estudio. En caso contrario podría obtenerse una muestra no representativa (sesgada).
5. Ver tabla 1 en Anexos
© Editorial UOC
143
Capítulo IV. Métodos de selección de muestras
•
Es un método sencillo si la población es pequeña, pero incómodo si es muy grande (imposibilidad de obtener listados completos).
•
Suele utilizarse como referencia para el cálculo del tamaño y error muestral, sea cuál sea el método probabilístico utilizado realmente.
•
Es el método menos preciso, es decir, el que proporciona un mayor error muestral.
Ejemplo de utilización La selección, en una fábrica de televisores, de una muestra de la producción diaria para proceder al control de calidad.
2.2. Muestreo aleatorio sistemático Es parecido al anterior, aunque mantiene algunas diferencias. Pueden destacarse las siguientes características: •
Únicamente se elige al azar el primer elemento (por el método aleatorio simple). El resto de elementos se seleccionan metódicamente (sistemáticamente) a partir del anterior, sumándole una determinada cantidad (coeficiente de elevación)
•
Este método, igual que el anterior, exige conocer a todos los elementos de la población y numerarlos (listado).
•
El error que proporciona es similar al del muestreo aleatorio simple.
Procedimiento de actuación: 1) Elección del primer elemento a1: • Se calcula el coeficiente de elevación C =
N n
• Se elije, por el método aleatorio simple, un elemento situado entre el primero y el indicado por C. 2) Elección del resto de elementos:
© Editorial UOC
144
Estadística para periodistas, publicitarios...
• Se obtienen sumando la cantidad C a cada uno de ellos. ai = ai-1 + C •
No conviene utilizar esta técnica cuando se supone que pueda existir algún patrón secuencial de los elementos (periodicidades ocultas).
•
Ventaja: no precisa del uso continuo de las tablas de números aleatorios como el método anterior.
Ejemplos de utilización Se aplica en las encuestas telefónicas, en los controles de calidad de la industria y, como veremos en los ejercicios, se ha utilizado en la elección de los jurados populares.
2.3. Muestreo aleatorio estratificado Es uno de los métodos más utilizados en la investigación social cuando se dispone de información sobre las características de la población de interés y ésta no es homogénea con relación a las variables objeto de estudio. Podemos destacar las siguientes características: •
Los elementos del universo se agrupan en conjuntos, denominados estratos, de manera que todos ellos sean lo más homogéneos posible. Si se trata de individuos, las agrupaciones pueden ser por sexo, edad, clase social, ocupación, nivel de formación, etc.
•
En estudios a nivel nacional o internacional suele estratificarse por ubicación geográfica (país, comunidad, provincia, municipio), por tipo de hábitat (urbano, semiurbano, rural) o por tamaño de hábitat (número de habitantes).
•
Se selecciona una muestra (submuestra) en cada uno de los estratos por uno de los métodos aleatorios anteriores (simple, sistemático).
•
La muestra final está formada por elementos de cada uno de los estratos (submuestras), asegurando así la representatividad de todas las características de la población.
© Editorial UOC
145
Capítulo IV. Métodos de selección de muestras
•
Es el método que, para un mismo tamaño muestral, garantiza la representatividad de la muestra, aumenta la fiabilidad o precisión y proporciona el mínimo error.
•
La elección de la muestra (submuestras) y su fiabilidad depende del método de afijación utilizado, siendo preferible el proporcional o aproporcional según el objetivo del estudio.
•
Es uno de los métodos más utilizados, conjuntamente con otros, en cualquier ámbito. Por ejemplo, en investigación de audiencias de televisión (audimetría).
Procedimientos de afijación Hay cuatro procedimientos que permiten calcular los tamaños de las submuestras en cada uno de los estratos. Se conocen como: simple, proporcional, óptimo y óptimo de costes variables. Simple - Cada estrato tiene el mismo número de elementos. El cálculo se efectua dividiendo el tamaño de la muestra total entre el número de estratos: ni = n/L n = tamaño total de la muestra; L = número de estratos definidos ni= tamaño de la submuestra en el estrato correspondiente - Esta elección favorece a los estratos de menor población (y perjudica a los de mayor población), pues tendrán el mismo número de elementos que los de superior tamaño por lo que estarán más representados. Proporcional Es uno de los métodos de afijación más utilizados. El número de elementos en cada estrato es directamente proporcional a su tamaño:
ni n = Ni N
© Editorial UOC
169
Capítulo V. Las fichas tecnicas
Capítulo V Las fichas técnicas
“En política pasa como en las matemáticas: todo lo que no es totalmente correcto está mal” (Edward Kennedy) En este capítulo se definirán aquellos conceptos relacionados con la fiabilidad e interpretación de los resultados procedentes de los estudios con muestras. Supondremos que éstas se han seleccionado por métodos aleatorios, facilitando así la proyección de sus resultados al universo definido, lo cual permite estimar los posibles valores que se obtendrían si pudiera analizarse éste en su totalidad. A partir de ejemplos publicados en la prensa, se introducirán los distintos conceptos objeto de este capítulo.
1. Artículos en la prensa. Comentarios
Es habitual, al hojear la prensa diaria, encontrarse con artículos relativos a resultados de encuestas o sondeos de opinión. Por ejemplo:1
1. La Vanguardia [Barcelona] (20 febrero 2007), Educación, p. 32.
© Editorial UOC
170
Estadística para periodistas, publicitarios...
O, incluso, en portadas en primera página:2
En dichos titulares, se menciona una cifra numérica (porcentaje) que hace mención explícita a toda la población objeto de interés (universo). No obstante, el resultado suele proceder del análisis en una muestra, salvo en aquellos casos, como el mostrado a continuación, en que el estudio es claramente censal o poblacional:3
Entonces, ¿es correcto inferir el resultado de una muestra como el estimado para el universo objeto de estudio?, ¿hay que considerar otros factores?, ¿existe algún error o desviación en los resultados?
2. La Vanguardia [Barcelona] (26 agosto 2000) 3. Ramos, I. La Vanguardia [Barcelona] (5 junio 2002), Sociedad, p. 27.
© Editorial UOC
171
Capítulo V. Las fichas tecnicas
Es práctica común en la prensa escrita citar como resultado poblacional el obtenido en una muestra. Sin embargo, estadísticamente no es correcto ya que puede dar lugar a interpretaciones erróneas, especialmente en aquellos lectores que desconozcan los fundamentos de los estudios en muestras. Según hemos comentado en capítulos anteriores, el resultado en una muestra difícilmente es el mismo que el que se obtendría al analizar a toda la población objeto de interés. Por otra parte, en algunos artículos y, posiblemente con la intención de no repetir la misma palabra, se mezclan términos que pueden aumentar la confusión del lector.4
El artículo anterior alude a “ciudadanos” y “barceloneses” indistintamente, aunque los resultados corresponden a las personas entrevistadas. En este caso, se está generalizando un resultado muestral puntual, lo cual, es incorrecto. Sería más adecuado utilizar algunos de los siguientes términos: encuestados, entrevistados, barceloneses encuestados o barceloneses entrevistados.
4. La Vanguardia, [Barcelona] (5 abril 2003), Vivir, p.6.
© Editorial UOC
172
Estadística para periodistas, publicitarios...
Recordemos que los resultados de la encuesta son los que aportan las personas seleccionadas que forman parte de ella y no es posible generalizar dicho resultado para el conjunto del universo objeto de interés. Son puntualizaciones que tienen su importancia y que considero interesantes enfatizar. Otro ejemplo, más reciente, aparece en el artículo Barcelona pide inmigrantes en el que se menciona:5 “…Según el sondeo, más de la mitad de los barceloneses (un 53,9%) considera que la sociedad catalana seguirá necesitando mano de obra inmigrada los próximos años, mientras que una proporción menor de entrevistados, un 36,6%, opina que hay una saturación en el número de extranjeros residentes en la ciudad...”.
Nuevamente, se cita por una parte al universo (barceloneses) y por otra a los componentes de la muestra (entrevistados) dando en ambos casos el resultado obtenido en la encuesta (muestra). Por suerte, no siempre ocurre así y existen muchos ejemplos de artículos que utilizan los términos estadísticamente correctos, evitando la confusión en la lectura o en su interpretación.6 Por ejemplo:
5. La Vanguardia [Barcelona] (27 marzo 2007), Vivir, p.1. 6. Quadrado, S. “Una encuesta del Govern da ganador a Mas frente a Maragall en la censura”. La Vanguardia [Barcelona] (24 octubre 2001), Política, p.18.
© Editorial UOC
173
Capítulo V. Las fichas tecnicas
2. Fichas técnicas. Ejemplo
Las fichas técnicas ofrecen información acerca de la metodología y procedimientos seguidos en la elaboración del trabajo de investigación. En ellas se indica quién ha efectuado el trabajo, cuando se ha llevado a cabo, qué método se ha seguido, como se ha seleccionado la muestra, y cuales son el margen de error y el grado de confianza del estudio. En general, cuando haya que analizar los resultados de una encuesta, debería conocerse cuál ha sido el método de selección de la muestra, la tasa
© Editorial UOC
174
Estadística para periodistas, publicitarios...
de respuesta, el error muestral, el grado de confianza, quién ha encargado y patrocinado el trabajo, qué gabinete y/o profesionales han realizado el estudio y el texto completo de las preguntas utilizadas. También habría que valorar la capacidad de las personas encuestadas para proporcionar respuestas con la suficiente reflexión e información previas. Según Dader (1992),7 son detectables los siguientes vicios y sesgos en la publicación de encuestas que realizan los medios de comunicación social: -
Ausencia de los datos de autoría de la encuesta
-
Publicación incompleta del cuestionario o preguntas formuladas
-
No diferenciar entre NS (no sabe) y NC (no contesta)
-
No diferenciar entre el “error global” y el “error de cada estrato”
-
No diferenciar entre el Universo y el marco muestral
-
No especificar la modalidad de la entrevista
-
No especificar el modo de estratificación de la muestra
-
No diferenciar entre la “muestra teórica” y la “real”
-
No especificar la dispersión geográfica de los puntos de muestreo
-
No reparar, al evaluar los datos, en el “margen de error muestral” y el “nivel de confianza” recogidos en la ficha técnica.
Es aconsejable manejar siempre los resultados finales con la prudencia necesaria. En especial, se debería recalcar el margen de error, cuando se pretenda extraer conclusiones sobre algún subconjunto de la muestra utilizada en el sondeo, y limitarse a extrapolar los datos de la muestra en aquella población de la que fue tomada (marco de muestreo), que habitualmente es distinta del universo teórico definido. Un ejemplo típico de ficha técnica que suele aparecer en la prensa escrita, es el siguiente: 7. Dader, J.L. (1992). El periodista en el espacio público. Barcelona, Bosch
© Editorial UOC
175
Capítulo V. Las fichas tecnicas
Figura 5.1 Ejemplo de ficha técnica publicado en la prensa
Veamos, a continuación, el significado e interpretación de los siguientes términos que en ella se citan: grado de confianza, error muestral, p y q, y sistema CATI.
2.1. Grado de confianza En la ficha técnica aparece como “intervalo de confianza” aunque la mayoría de autores lo denominan “grado o nivel de confianza”. El grado de confianza representa la seguridad de que al efectuar la estimación poblacional, ésta se encontrará entre los límites de confianza hallados.8 De alguna forma, equivale a la “confianza” con la que se infiere el valor poblacional a partir de los resultados en la muestra seleccionada. Según citan Rodríguez (1991:51) y Cea d'Ancona (1998:173), equivale a “…la probabilidad de acierto en la estimación.” Según cuál sea el grado de confianza asumido (es una de las hipótesis de trabajo), queda determinado el valor de la constante K.9 En investigación de
8. Los límites de confianza son aquellos valores que resultan de sumar y restar el error muestral al resultado obtenido en la muestra, según comentaremos más adelante en este mismo capítulo. 9. Constante asociada al grado de confianza. Se le conoce también como “número de sigmas”. Sus valores se derivan a partir de las propiedades de la curva normal.