Report readability 20120311

Page 1

(Аа)2

Алекс и Алекс e-­‐mail: alex@alex-­‐alex.ru web: http://alex-­‐alex.ru

Удобочитаемость текста современных интернет-­‐СМИ

11 марта 2012 года


2

Удобочитаемость современных интернет-­‐СМИ Основные результаты ................................................................................ 3 История вопроса ............................................................................................ 3 Российская специфика ............................................................................... 6 Проблема ........................................................................................................... 6 Методика ........................................................................................................... 7 Результаты ....................................................................................................... 7 Выводы и рекомендации ........................................................................ 11


3

Основные результаты В ходе исследования средней длины предложений в но-­‐ востных материалах были получены, в частности, следую-­‐ щие результаты. • Средняя длина новостного заголовка составляет 7 – 9 слов. Длина заголовка очень редко превышает 10 слов. • Средняя длина предложения в российских интернет-­‐ изданиях обычно не превышает 18 слов. • Длина предложений в целом сокращается, либо оста-­‐ ется на том же уровне. Темпы сокращения достаточно велики: за пять лет, с июня 2004 по июнь 2009, длина предложения в Ленте.ру сократилась на почти 14 про-­‐ центов. • Беглый просмотр дополнительных изданий показыва-­‐ ет, что оптимальной длиной предложения в изданиях, рассчитанных на массовую аудиторию, являются 14-­‐ 15 слов. Этот показатель может быть меньше для таблоидов.

История вопроса В большинстве руководств по написанию эффективных текстов говорится о силе коротких предложений. Считает-­‐ ся, что читатель лучше, c большей охотой их запоминает. Почему так? Насколько сильно длина предложения влияет на восприятие? На этот вопрос отвечала не одна команда исследователей. Ниже приводятся данные по текстам на английском языке, но надо думать, что с определенными поправками тенденции/показатели справедливы и для русского.


4 Авторы книги Business Communication: Process and Product1 ссылаются на данные American Press Institute: • читатель понимает предложения длиной в 8 слов в 100% случаев; • в случае 15 слов показатель снижается до 90%; • 19 слов -­‐ 80%; • 28 слов -­‐ 50%. В книге рекомендуется по возможности ставить точки вме-­‐ сто слов "и", "но" и "хотя". При этом авторы подчеркивают -­‐ не стоит писать по-­‐школьному. Очередь из слишком корот-­‐ ких предложений создает впечатление монотонности. Конечно, средняя длина предложения зависит от характера текста. Например, учебники для юристов предлагают огра-­‐ ничиться в среднем 20 словами на предложение (Garner, B. A. Legal writing in plain English: a text with exercises. University of Chicago Press, 2001). В диссертациях для получения степени PhD рекомендуется не писать предложения длиннее 40 слов (Dunleavy, P. Authoring a PhD: how to plan, draft, write, and finish a doctoral thesis or dissertation. Palgrave Macmillan, 2003). Со временем длина предложения сокращается. В конце де-­‐ вятнадцатого века профессор Люциус Аделно Шерман про-­‐ анализировал отрывки из книг разных времен. Он обнару-­‐ жил, что до королевы Елизаветы средняя длина предложе-­‐ ния составляла 50 слов. В елизаветинские времена она со-­‐ кратилась до 45. В викторианские -­‐ до 29. А во времена са-­‐ мого Шермана уже составляла 23 слова. Интересно, что за целый век показатель не сильно упал и для английского языка составляет как раз около 20 слов (DuBay, W. H.The Principles of Readability, стр.102).

1 http://books.google.ru/books?id=W6DCJ0cLf3MC

2 http://www.impact-information.com/impactinfo/readability02.pdf


5 Если говорить о новостных текстах, то основополагающим здесь являются исследования Рудольфа Флеша (Rudolph Flesch; разработал знаменитую шкалу удобочитаемости Flesch/Flesch–Kincaid Test3) и Роберта Ганнинга (Robert Gunning). Последний к 1952 году показал, что при чтении новостей на предложение приходится всего 16 слов. Если оценивать эти данные по таблице удобочитаемости Флеша, опубликованной в 1949 году, получится, что для полного понимания новостей достаточно 6-­‐7 классов образования. С ростом длины предложения повышаются и требования к образованности читателя. Исследование (Jung, J. Business News Web Sites Differ from Newspapers in Business Content//Newspaper Research Journal4), опубликованное в 2003 году, показало, что длина предложений в статьях на деловых новостных сайтах (CBSMW, CNBC, CNNfn5) состав-­‐ ляет 23-­‐24,9 слова. Интересно, что у бумажного The Wall Street Journal тот же показатель составил 19,9 (близко к упоминавшемуся идеа-­‐ лу), для USA Today – 19,7. Рекорд же поставила The New York Times, авторы которой помещают в предложение 27,7 слова. Подобные показатели многое могут сказать про аудито-­‐ рию, формат и даже приверженность традициям того или иного издания. Наконец, этот обзор был бы неполон без ссылки на Якоба Нильсена6, который ограничивает допустимую длину заго-­‐ ловка (так называемого микроконтента, призванного объ-­‐ яснить макроконтент) 40-­‐60 знаками. Впрочем, микрокон-­‐ тент, восприятие заголовка и его элементы – отдельная, очень большая тема.

3 http://en.wikipedia.org/wiki/Flesch%E2%80%93Kincaid_readability_test 4 http://www.questia.com/googleScholar.qst?docId=5002540943 5 CNN financial news

6 http://www.useit.com/alertbox/980906.html


6

Российская специфика В России исследования удобочитаемости текстов прово-­‐ дятся нечасто. Из работ, затрагивающих эту тематику, можно выделить диссертацию Ирины Оборневой («Авто-­‐ матизированная оценка сложности учебных текстов на ос-­‐ нове статистических параметров», 2006 год), где проанали-­‐ зирован корпус текстов, содержащий несколько миллионов слов. Однако ее работа посвящена учебно-­‐методическим текстам, в то время как нас интересуют новостные сообще-­‐ ния. Частотный словарь русского языка, доступный для скачи-­‐ вания с сайта Российского НИИ искусственного интеллек-­‐ та7, дает следующие показатели: • Средняя длина слова 5,28 символа; • Средняя длина предложения 10,38 слова. Опять же, это ничего не говорит о том, как лучше излагать новости.

Проблема Как дело обстоит с новостными текстами в русском языке? Исследования традиционных газетных текстов проводи-­‐ лись, однако для интернет-­‐СМИ этот вопрос по-­‐прежнему актуален. Компания «Алекс и Алекс» провела мини-­‐исследование, це-­‐ лью которого стало определение в первом приближении сформировавшихся длин заголовков и предложений в текстах. С определенными поправками и оговорками мож-­‐ но предположить, что показатели в текстах крупных СМИ близки к оптимальным.

7 http://www.artint.ru/projects/frqlist.php


7

Методика Для исследования были взяты тексты двух изданий: Lenta.ru и Newsru.com. В первом случае были взяты полные тексты материалов в период с 1999 по 2009 год8. Во втором – произведена небольшая выборка текстов (по одному дню из каждого месяца в течение 2011, 2010 и частично – 2009 гг). Затем были сформированы наборы, состоящие из заголовков и текстов материалов. В этих наборах и были определены длины предложений, которые мы разбили по периодам, получив возможность проследить динамику этих показателей. Недостатки методики заключаются в малом охвате интер-­‐ нет-­‐СМИ. В будущем компания планирует представить бо-­‐ лее развернутый отчет, а также готова подготовить подоб-­‐ ные отчеты на заказ для конкретных изданий.

Результаты Lenta.Ru. Заголовки Средняя длина новостного заголовка Lenta.ru9 по состоя-­‐ нию на 2009 год составляла 6,66 слова. В период с 1999 по 2009 год она колебалась в пределах от 6,66 до 7,71 слова. В период с 2004 по 2009 она достигала 7,52 слова. В среднем за десять лет длина заголовка составляла 7,20 слова, а за пять – 7,15.

8 Несмотря на доступность этого периода, рассматривались данные с 2004 года,

так как объем информации в предыдущие годы оказался сравнительно неве-­‐ лик. Тем не менее, данные по годам с 1999 по 2003 позволили уточнить тен-­‐ денции в изменении удобочитаемости текстов. 9 Обработано 304388 заголовков


8

Период Среднее число слов в новостном заго-­‐ ловке, Lenta.ru 1999 6,75 2000 6,99 2001 7,33 2002 7,52 2003 7,71 2004 7,52 2005 7,34 2006 7,245 2007 7,015 2008 7,145 2009 6,66

Обработано за-­‐ головков 3207 18265 25708 25790 23212 25865 31049 35514 35845 49174 30759

Формат заголовков Lenta.ru – простые, малораспростра-­‐ ненные предложения. Длина таких заголовков очень редко превышает 10 слов.

В целом этот показатель снижается. Заголовок образца 2009 года на 11 процентов короче заголовка 2004 года.


9

Lenta.ru. Тексты Анализ более чем 460 тысяч предложений из текстов Len-­‐ ta.ru за период с июня 2005 по июнь 2009 года показывает, что длина предложений со временем падает, стабилизиру-­‐ ясь на уровне 14,5 – 15 слов на предложение. Величина сокращения довольно велика: с июня 2005 по июнь 2009 года предложения сократились почти на чет-­‐ верть. Если американские исследователи, чьи данные при-­‐ водились выше, правы, ранее пользователям было непо-­‐ нятно каждое пятое предложение в текстах, в то время как к середине 2009 года – каждое десятое.


10 NewsRu.com. Заголовки и тексты Заголовки NewsRu.com допускают распространенные и да-­‐ же сложные предложения. Как результат – они в целом длиннее, однако и здесь средний размер заголовка не пре-­‐ вышает 10 слов, составляя 9,64 слова. В текстах NewsRu.com средняя длина предложения в последние годы колеблется между 17,26 и 18,59 слова, в среднем составляя 17,73 слова. Ниже дается график за пять расчетных периодов – полугодий.


11

Выводы и рекомендации Анализ текстов Lenta.ru и NewsRu.com показывает, что длина заголовка новостного издания не должна превышать 10 слов. В то же время оптимальным кажется размер заго-­‐ ловка примерно в 7 слов, если речь идет о глагольном заго-­‐ ловке с упоминанием ключевых фактов или действующих лиц. Средняя длина предложения в новостных изданиях обычно не превышает 18 слов. Кажется стабильным показатель в 14-­‐15 слов, хотя беглый просмотр текстов некоторых дру-­‐ гих изданий10 показывает, что длина предложения, особен-­‐ но в таблоидах, может опускаться до показателя в 12 и ме-­‐ нее слов. На удобочитаемость текстов, одним из ключевых факторов которой является длина предложения, сильно влияет ре-­‐ дакционная политика. Дополнительная вычитка, проверка, редактура, правила по оформлению текстов помогают сде-­‐ лать новости и статьи гораздо более понятными и привле-­‐ кательными для читателей.

10 Не названы, так как данных недостаточно для обоснованных выводов.


Отчет подготовлен для вас компанией «Алекс и Алекс» Компания «Алекс и Алекс» основана в 2011 году Алексан-­‐ дром Амзиным. Александр -­‐ автор книги «Новостная ин-­‐ тернет-­‐журналистика», преподаватель кафедры новых ме-­‐ диа на журфаке МГУ, бывший сотрудник Lenta.ru, в течение пяти лет занимавший посты главы в различных отделах издания. Компания «Алекс и Алекс» специализируется на медиакон-­‐ салтинге: редакционных тренингах, аудите контента и ре-­‐ дакционных процессов, помощи в запуске и работе изда-­‐ ний. Мы проводим исследования и мониторинг медиа-­‐ среды, а также предоставляем контентные услуги. Вы можете связаться с нами по почте alex@alex-­‐alex.ru. Наш сайт: alex-­‐alex.ru.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.