Целесообразность разработки систем автоматизации перевода объясняется рядом объективных условий: наличием большого, постоянно возрастающего потока зарубежной патентной документации; необходимостью оперативного оповещения о новых изобретениях; стандартизацией языка патентной документации, облегчающей разработку алгоритмов и т. д. Проблемой автоматического перевода ЦНИИПИ занимается с 1963 г. Разрабатываемые системы предназначаются для перевода патентной документации с английского и японского языков. Автоматизация перевода представляет собой наиболее сложную задачу, непосредственно связанную с решением различных теоретических проблем лексики, грамматики, семантики. Поэтому проводившиеся до сих пор работы носили в основном экспериментальный характер. В 1964-1966 гг. в ЦНИИПИ была разработана и запрограммирована экспериментальная система так называемого «сегментного» автоматического перевода публикаций из «Official Gazette.

Если первый из разработанных в ЦНИИПИ алгоритмов был предназначен для пословного перевода, а второй предполагал лишь отдельные виды грамматического согласования, то алгоритм сегментного анализа обеспечивает значительно более высокое качество перевода, с развернутым согласованием русских эквивалентов. В названии алгоритма отражена основная идея, положенная в его основу: он обеспечивает членение английского текста на сегменты; выявление моделей этих сегментов, выраженных в индексах классов входящих в сегменты слов; нахождение эквивалентных моделей русского языка; выработку информации о грамматических формах русских слов и синтез русского текста в соответствии с этой информацией (Л4-13). Система перевода публикаций из «Official Gazette» сейчас находится в опытной эксплуатации. Время перевода одной публикации размером 150-300 слов составляет от 2 до 5 мин. (на вычислительной машине с быстродействие около 8 тыс. операций в 1 сек.). Наряду с проведением опытных переводов и внесением изменений в алгоритм и программу в ЦНИИПИ разрабатывается усовершенствованный вариант системы англо-русского автоматического перевода характеризующийся некоторыми принципиально новыми чертами: углубление синтаксического анализа, введение семантического анализа и др. Эта система будет менее специализированной и обеспечит возможность перевода любых видов патентной документации с английского языка на русский.

Для организации массового перевода патентной и другой документации с английского языка на русский необходимо, наряду с дальнейшим совершенствованием алгоритмов анализа и синтеза, организовать составление словарей самой различной тематики. Эта работа может быть выполнена при активном участии отраслевых органов информации.

Кроме того, уже в настоящее время существует возможность практического применения системы автоматического перевода при автоматизации отдельных этапов переводческого процесса (например, поиск в словаре) переводе указателей ключевых слов и индексировании патентной документации на иностранных языках и т. д. Те или иные элементы системы автоматического перевода входят в качестве составных частей в системы различного назначения. Поэтому накопленный ЦНИИПИ опыт полезен при разработке комплексной системы в целом.