ISBN 5-89520-002-8

ЧЕМ ДЛИННЕЕ, ТЕМ ЛУЧШЕ? КАК СРАВНИТЬ ДЛИНЫ ИСХОДНОГО ТЕКСТА И ПЕРЕВОДА?

© 2003 г. М. Н. Михайлов

В статье рассматривается вопрос о соотношении длины исходного текста и его перевода на другой язык. Ю. Найда [Nida & Taber 1974] утверждает, что перевод обязательно должен быть длинее оригинала, поскольку переводчик должен объяснять реалии, не существующие в языке перевода, передавать языковую игру и т.п. Задачей статьи и было проверить это утверждение.

Поскольку исходный текст и перевод пишутся на разных языках, сравнение по количеству слов, предложений и даже знаков представляется малопродуктивным занятием. Поэтому решено было привлечь теорию информации, а именно — энтропию, единицу “плотности” информации. Соотношение энтропий языков оригинала и перевода использовалось в качестве поправочного коэффициента при сравнении длин текстов в символах.

Эксперименты на русско-финских, англо-русских и русско-английских параллельных текстах показали, что предположение Ю. Найды в целом верно. Тем не менее, некоторые переводы все же оказались несколько “короче” оригиналов, что говорит наличии в этих переводах сокращений, упрощений или даже пропусков.

Перевод с одного языка на другой – это попытка перекодировать текст на одном языке в текст на другом языке. В отличие от других видов перевода, выделяемых Р.О. Якобсоном – пересказа и межсемиотического перевода [Якобсон 1985], – в которых используется та же самая или принципиально другая семиотическая система, в случае межязыкового перевода применяется семиотическая система того же типа – другой естественный язык. Поскольку языки отличаются друг от друга, информационные потери неизбежны, и их нужно как-то компенсировать. Поэтому Ю. Найда и Ч. Табер утверждают, что хороший перевод всегда несколько длиннее исходного текста, поскольку переводчик должен эксплицировать понятия, отсутствующие в языке перевода [Nida & Taber 1974: 163].

Это утверждение в целом не вызывает никакого протеста [Следует тем не менее отметить, что единого представления о том, что такое “хороший перевод”, не существует: кто-то может считать, что главное в переводе – верность оригиналу, кто-то – что важнее хороший стиль, причем требования это могут меняться от эпохи к эпохи и зависят от типа переводимого текста [см., например, Chesterman 1997]].

Тем не менее, представляется интересным проверить, насколько оно соответствует реальной практике перевода. Такая проверка оказывается не столь тривиальной процедурой, как это может показаться. Ведь длину текста можно измерять по-разному: в знаках, в словоупотреблениях, в предложениях, в абзацах и т.п. Кроме того, грамматический строй и особенности стиля исходного языка и языка перевода (далее – ИЯ и ПЯ) не могут не влиять на длину перевода. Кроме того, некоторое сомнение вызывают утверждения Найды и Табера о том, что во всех языках избыточность (redundancy) составляет примерно 50% и что “плотность” информации для разных языков одинакова [там же].

Использование предложения или абзаца в качестве единицы измерения длины текста представляется малопродуктивным по целому ряду причин. Во-первых, длина предложения или длина абзаца очень сильно варьируется. Например, в романе Булгакова “Мастер и Маргарита” длина предложения колеблется от одного до ста девяти словоупотреблений. Бoльшая часть предложений романа имеет длину от одного до двадцати пяти словоупотреблений. Во-вторых, переводчик в большинстве случаев — осознанно или неосознанно — переводит одно предложение одним предложением и один абзац — одним абзацем [подробнее об этом см. Mihailov 2001]. Поэтому количество предложений и абзацев в переводе как правило оказывается близким к количеству предложений и абзацев в оригинале.

Использование слова в качестве единицы измерения длины текста также не даст надежных результатов. Сравнивать количество словоупотреблений в текстах на двух разных языках с очень сильно различающимся грамматическим строем — весьма проблематичное занятие. Например, если в языке есть артикли, то количество словоупотреблений в сообщении на этом языке будет, как правило, больше, чем в переводе этого сообщения на безартиклевый язык. Аналитический язык более “многословен”, чем синтетический. Таким образом, сравнение длин текстов, написанных на разных языках с использованием словоупотреблений в качестве меры длины, также мало о чем говорит.

Таким образом, остается только одно: измерять длины текстов в символах. Однако и здесь остается открытым тот же вопрос. В разных языках для передачи одинаковых по смыслу сообщений используются разные слова, длина которых может быть как близкой, так и различной. Слова эти могут употребляться в различных грамматических формах, для чего используются морфемы или служебные слова, длины которых также могут различаться. Таким образом, для передачи одной и той же информации в разных языках могут порождаться сообщения разной длины. Утверждение о том, что текст на языке А длиннее текста на языке Б, потому что в первом тексте больше символов, представляется нам не совсем корректным.

Для проведения нашего небольшого исследования был привлечен русско-финский, англо-русский и русско-английский материал. Наиболее представителен финско-русский массив текстов. Это русско-финский параллельный корпус художественных текстов “ПарРус”, собранный на Отделении переводоведения Тамперского университета (Финляндия). В состав корпуса включены произведения русской литературы XIX-XX вв. (всего 128 текстов) и их переводы на финский язык. Объем корпуса составляет около 2,2 млн. словоупотреблений на каждом из языков [см. напр., Mihailov 2002]. Для проверки данных, полученных при анализе финско-русских текстов, использовались относительно небольшие по объему англо-русский и русско-английский массивы художественных текстов. В англо-русский корпус включены произведения английской литературы XIX-XX вв. (Диккенс, Мэри Шэлли, Стивенсон, Конан Дойл, Честертон, Хэммингуэй и др.) и их переводы на русский язык. Объем массива составил порядка 800 тыс. словоупотреблений на каждом из языков. Несколько больше по объему русско-английский корпус, в который были включены произведения русской литературы XIX-XX вв. (Гоголь, Лермонтов, Достоевский, Толстой, Булгаков и др.) и переводы этих произведений на английский язык, выполненные носителями английского языка. Объем этого массива составляет около 1,5 млн. словоупотреблений на каждом из языков.

Сравнение длин исходных текстов и их переводов в символах показала, что соотношение длин в значительной степени определяется парой языков. При переводе с русского на финский и с русского на английский длина перевода в символах оказывается больше, однако при переводе с английского на русский текст перевода оказывается заметно короче (результаты по некоторым текстам см. в табл. 1-3).

Таблица 1. Длина текстов в символах: русско-финские тексты

 

Символы

Оригинал Перевод Отношение
Аксенов В., “Звездный билет”, пер. Э. Адриан (Esa Adrian)

293833

329404

0,90

Бакланов Г., “Навеки девятнадцатилетние”, пер. В. Орлов (Vappu Orlov)

312285

381108

0,82

Белов В., “Привычное дело”, пер. Х. Лааксонен (Hugo Laaksonen)

287562

317852

0,91

Горький М., “Старуха Изергиль”, пер. А. Митрошин (Anita Mitroshin)

40318

48885

0,83

Ерофеев В., “Москва – Петушки”, пер. Э. Адриан (Esa Adrian)

205638

228171

0,90

Лермонтов М.Ю., “Герой нашего времени”, пер. У.-Л. Хейно (Ulla-Liisa Heino)

263582

315782

0,84

Пастернак Б.Л., “Доктор Живаго”, пер. Ю. Конкка (Juhani Konkka)

989604

1146650

0,86

Таблица 2. Длина текстов в символах: русско-английские тексты

  Символы
Оригинал Перевод Отношение
Булгаков М.А., “Мастер и Маргарита”, пер. Р. Пивир и Л. Волконски (R. Pevear & L. Volokhonsky)

751334

832438

 
Гоголь Н.В., “Шинель”, пер. И. Хэпгуд (Isabel F. Hapgood)

65095

67862

 
Достоевский Ф.М., “Преступление и наказание”, пер. К. Гарнетт (Constance Garnett)

1073531

1118797

 
Ильф И., Петров Е., “Двенадцать стульев”, пер. Дж. Ричардсон (John Richardson)

548410

591748

 
Лермонтов М.Ю., “Герой нашего времени”, пер. Х. Уиздом и М. Муррэй (H. Wisdom & M. Murray)

263306

323782

 
Толстой Л.Н., Анна Каренина, пер. К. Гарнетт (Constance Garnett)

1697480

1938807

 

Таблица 3. Длина текстов в символах: англо-русские тексты

  Символы
Оригинал Перевод Отношение
G. K. Chesterton, “The man who was Thursday” (“Человек, который был четвергом”), пер. Н.Трауберг

313400

247205

 
A. Conan Doyle, “The Hound of the Baskervilles” (“Собака Баскервилей”), пер. Н. Волжина

312332

296092

 
Charles Dickens, “The posthuomous papers of the Pickwick club” (“Посмертные записки Пиквикского Клуба”), пер. А.В. Кривцова и Е. Ланн

1717788

1641772

 
E. Hemingway, “Green hills of Africa” (“Зеленые холмы Африки”), пер. Н.Волжина и В.Хинкис

349181

350835

 
Jerome K. Jerome, “Three Men in a Boat” (“Трое в одной лодке”), пер. М. Донской и Э. Линецкая

353306

359177

 
M. Shelley, “Frankenstein, or the Modern Prometheus” (“Франкенштейн, или современный Прометей”), пер. З. Александрова

418491

359255

 
R. L. Stevenson, “Treasure Island” (“Остров сокровищ”), пер. Н. Чуковский

355737

333390

 

Таким образом, полученная нами статистика по параллельным текстам не говорит ни за, ни против гипотезы Найды. Для решения этого вопроса необходимо подойти к этому вопросу с другой стороны. Обратимся к математической теории информации. В математике понятие “информация” несколько отличается от бытового и связывается с количеством альтернатив при выборе очередного элемента сообщения. В качестве меры количества информации используется энтропия, степень свободы выбора на каждом шаге порождения сообщения. Таким образом, энтропия тесно связана с вероятностью. Для сообщения с алфавитом из n букв энтропия (H) вычисляется по формуле:

, где p1, p2, ... pn — вероятности появления в сообщении различных символов [Oakes 1998: 58-60].

Для разных языков значение энтропии различается, поскольку даже если используется один и тот же алфавит (хотя полное совпадение алфавитов наблюдается довольно редко, например, почти во всех языках, использующих латиницу, либо есть дополнительные буквы, либо отсутствуют какие-либо из стандартных букв), частота букв и иных знаков (например, знаков препинания), а также их сочетаемость все же различается. В наших массивах были получены следующие значения энтропии: русский язык — 4,56 бит/символ (стандартное отклонение — 0,03), английский язык — 4,27 бит/символ (стандартное отклонение — 0,04), финский язык — 4,20 бит/символ (стандартное отклонение — 0,03). Таким образом, энтропия всех трех языков отличается.

В наших экспериментах учитывались данные, полученные на достаточно длинных текстах, длина которых превышала 4000 словоупотреблений. Тем не менее, значения энтропии, полученные даже для очень коротких текстов корпуса, оказались удивительно стабильными. Например, энтропия рассказов Чехова, длина которых составляла менее тысячи словоупотреблений (длина самого короткого текста — рассказ “Неудача” — 468 словоупотреблений) не отклонялась от полученного нами среднего значения энтропии более чем на 0,05. Таким образом, по-видимому, значение энтропии не зависит от длины текста. Связи между энтропией оригинала и энтропией перевода также не прослеживается. В графике на рис. 1 по оси x отложены значения энтропии русских оригинальных текстов, по оси y – значения энтропии финских переводов. Как видно из полученного графика, высоким значениям энтропии исходного текста могут соответствовать низкие значения энтропии в переводах и наоборот, то есть никакой определенной тенденции не прослеживается.

Рис. 1. Энтропия оригинала vs. энтропия перевода: русско-финские тексты

Представляется, что энтропия как мера “плотности” информации может помочь нам решить вопрос о соотношении длины оригинального текста и его перевода: ведь количество информации – как бы мостик между разными языками. Предположим, что энтропия влияет на длину сообщения в символах, порождаемого на данном языке. Тогда отношение длин текстов на разных языках, содержащих одинаковый объем информации (ведь перевод в идеале должен содержать ту же информацию, что и оригинал), будет равно отношению энтропий языков, на которых написаны тексты:

Коэффициент k, равный отношению энтропий ИЯ и ПЯ, можно использовать в качестве поправки при сравнении длин оригинала и перевода:

, где k — отношение энтропий ИЯ и ПЯ, nsl и ntl — длины исходного текста и перевода (в символах).

Если p = 1, то оригинал и перевод “одинаковой длины”, то есть различие в длине текста связано лишь со спецификой кодирования сообщения на данном естественном языке. Если p > 1, то исходный текст “длиннее”, а в случае, если p < 1, то “длиннее” перевод.

По данным “ПарРус” коэффициент k для русско-финских текстов равен 1,087. Сравнение длин текстов корпуса показало, что переводы действительно “длиннее” оригиналов в том смысле, что длины текстов оказываются больше, чем они должны были бы быть, если бы в переводе заключалось столько же информации, как и в оригинале: значение коэффициента p почти для всех текстов оказывается меньше 1. Единственное исключение в нашем корпусе — роман И. Ильфа и Е. Петрова “12 стульев” и его перевод на финский язык, сделанный Р. Сильванто и Ю. Конкка (p = 1,136). Причина заключается в том, что перевод был сделан с первого издания романа, текст которого очень сильно отличается от издания 1956 г., представленного в “ПарРус”. Ниже представлена часть полученных нами экспериментальных данных (см. табл. 4; в колонке nsl/ntl указывается отношение длины исходного текста к длине перевода, в столбце p – значение отношения с учетом поправки).

Таблица 4. Соотношение длин оригинальных текстов и их переводов: русско-финские тексты

nsl/ntl p
Аксенов В., “Звездный билет”, пер. Э. Адриан (Esa Adrian)

0,90

0,97

Бакланов Г., “Навеки девятнадцатилетние”, пер. В. Орлов (Vappu Orlov)

0,82

0,89

Белов В., “Привычное дело”, пер. Х. Лааксонен (Hugo Laaksonen)

0,91

0,98

Горький М., “Старуха Изергиль”, пер. А. Митрошин (Anita Mitroshin)

0,83

0,90

Ерофеев В., “Москва – Петушки”, пер. Э. Адриан (Esa Adrian)

0,90

0,98

Лермонтов М.Ю., “Герой нашего времени”, пер. У.-Л. Хейно (Ulla-Liisa Heino)

0,84

0,91

Пастернак Б.Л., “Доктор Живаго”, пер. Ю. Конкка (Juhani Konkka)

0,86

0,93

Используя лишь данные по переводу с русского на финский, сложно оценить оправданность применения поправочного коэффициента и правильность полученных результатов, поскольку длины финских переводов и так меньше длин исходных русских текстов. Полезность этого коэффициента становится очевидной при сравнении англо-русских текстов. Как уже говорилось выше, при переводе с английского на русский язык текст перевода, как правило, оказывается короче исходного текста. Применение поправочного коэффициента показывает, что переводы и в этом случае, как правило, оказываются “длиннее” исходных текстов (см. табл. 6).

Для русско-английских и англо-русских параллельных текстов коэффициент k равен соответственно 1,056 и 0,934. Результаты, полученные в ходе наших экспериментов, представлены в таблицах 5 и 6.

Таблица 5. Соотношение длин оригинальных текстов и их переводов: русско-английские тексты

  nsl/ntl p
Булгаков М.А., “Мастер и Маргарита”, пер. М. Глэнни (Michael Glenny)

0,96

1,01

Булгаков М.А., “Мастер и Маргарита”, пер. Р. Пивир и Л. Волконски (R. Pevear & L. Volokhonsky)

0,90

0,95

Булгаков М.А., “Собачье сердце”, пер. М. Глэнни (Michael Glenny)

0,88

0,93

Гоголь Н.В., “Шинель”, пер. И. Хэпгуд (Isabel F. Hapgood)

0,96

1,01

Достоевский Ф.М., “Идиот”, пер. Э. Мартин (Eva Martin)

0,98

1,03

Достоевский Ф.М., “Преступление и наказание”, пер. К. Гарнетт (Constance Garnett)

0,96

1,01

Ильф И., Петров Е., “Двенадцать стульев”, пер. Дж. Ричардсон (John Richardson)

0,93

0,98

Лермонтов М.Ю., “Герой нашего времени”, пер. Х. Уиздом и М. Муррэй (H. Wisdom & M. Murray)

0,81

0,86

Толстой Л.Н., Анна Каренина, пер. К. Гарнетт (Constance Garnett)

0,88

0,92

Таблица 6. Соотношение длин оригинальных текстов и их переводов: англо-русские тексты

  nsl/ntl p
G. K. Chesterton, “The man who was Thursday” (“Человек, который был четвергом”), пер. Н.Трауберг

1,27

1,18

A. Conan Doyle, “The Hound of the Baskervilles” (“Собака Баскервилей”), пер. Н. Волжина

1,05

0,99

Charles Dickens, “The posthuomous papers of the Pickwick club” (“Посмертные записки Пиквикского Клуба”), пер. А.В. Кривцова и Е. Ланн

1,05

0,98

E. Hemingway, “Green hills of Africa” (“Зеленые холмы Африки”), пер. Н.Волжина и В.Хинкис

1,00

0,93

Jerome K. Jerome, “Three Men in a Boat” (“Трое в одной лодке”), пер. М. Донской и Э. Линецкая

0,98

0,92

M. Shelley, “Frankenstein, or the Modern Prometheus” (“Франкенштейн, или современный Прометей”), пер. З. Александрова

1,16

1,09

R. L. Stevenson, “Treasure Island” (“Остров сокровищ”), пер. Н. Чуковский

1,07

1,00

Как видно из таблиц 5 и 6, для русско-английских и англо-русских параллельных текстов результаты оказались не столь однозначными, как для переводов с русского языка на финский: в ряде случаев k несколько больше единицы. Скорее всего, в этих переводах допускались сокращения и незначительные пропуски в переводе для получения более естественного текста на ПЯ. Нередко более важным для переводчика оказывается сделать текст интересным и легко читаемым на языке перевода. В этих случаях переводчики могут опускать некоторые специфические культурные реалии и/или отказаться от передачи труднопередаваемых на ПЯ языковых особенностей исходного текста, что может вызвать в итоге сокращение текста перевода по сравнению с оригиналом.

Такая стратегия нередко использовалась в XIX веке. Например, в переводе на английский язык повести Пушкина “Капитанская дочка” (“Marie, or Russian Love”, Мари де Зиелинска (Marie H. de Zielinska), 1876) отсутствуют пушкинские эпиграфы к главам, а также довольно много пропусков по сравнению с исходным текстом.

Даже в настоящее время существует традиция сокращенного перевода, например, перевод классической литературы для детей школьного возраста. В качестве примеров можно привести переводы романов Дэфо и Свифта на русский язык. Перевод роман Гарриэтт Бичер-Стоу “Хижина дяди Тома” на русский язык на треть короче оригинального английского текста, несмотря на большое количество довольно подробных примечаний переводчика.

Итак, нам удалось получить косвенные подтверждения гипотезы Ю. Найды о том, что перевод длиннее оригинала. Общая тенденция, по нашим данным, действительно состоит в том, что перевод оказывается несколько более громоздким, чем оригинал. Тем не менее, следует сделать уточнение, что перевод оказывается длиннее оригинала лишь в том случае, если переводчик стремится, насколько это возможно, передать в переводе все особенности языка оригинала, сохранить все культурные реалии из исходного текста.

Сравнение длин исходного текста и перевода с учетом энтропий ИЯ и ПЯ, позволяет судить, насколько следует перевод тексту оригинала. Чем меньшее значение коэффициента получено, тем более бережно относился переводчик к исходному тексту. Однако результат такого поверхностного сравнения показывает только общую тенденцию в данном переводе: низкое значение коэффициента вовсе не означает, что в исследуемом переводе отсутствуют пропуски и приблизительные соответствия. Вопрос об определении количества потерь при переводе и возможности их минимизации остается открытым.

Литература

  1. Якобсон Р.О. 1985: О лингвистических аспектах перевода. В сб.: Р.О. Якобсон. Избранные работы. М: Прогресс. С. 361-368.
  2. Chesterman, Andrew 1997: Memes of translation: the spread of ideas in translation theory. Amsterdam/Philadelphia: John Benjamins.
  3. Mihailov, Mihail 2001: Two Approaches to Automated Text Aligning of Parallel Fiction Texts. Across Languages and Cultures 2(1), pp. 87-96.
  4. Mihailov, Mihail 2002: Rinnakaistekstikorpus kaantajan apuvalineena. Kaantaja # 4. s. 12.
  5. Nida E.A. & Taber C.R. 1974: The Theory and Practice of Translation. Leiden: E.J. Brill.
  6. Oakes, Michael 1998: Statistics for Corpus Linguistics. Edinburgh University Press.

THE LONGER THE BETTER? IS IT POSSIBLE TO COMPARE LENGTHS OF SOURCE TEXT AND TRANSLATION?

M. N. Mikhailov

The problem discussed in this paper is the correlation between length of source text and its translation into another language. It is not possible to directly compare paragraph, sentence, or character counts, since source and target texts are written in different languages. Therefore, the theory of information was employed. The correction quotient for character counts’ ratio was worked out. Experiments on Russian-Finnish, English-Russian, and Russian-English parallel texts show that in most cases translations tend to be ‘longer’ than the original texts. However, some of the translations were ‘shorter’, which could mean that there are certain information gaps in these translations.

Тамперский университет (Финляндия)

Поступила в редакцию 24.02.2003.