Думать об обучении собственного движка перевода стоит лишь в том случае, когда у вас в распоряжении есть корпус текстов из пяти, десяти, а лучше — пятнадцати тысяч переведённых сегментов.
Сегмент — это минимальная переводческая единица, загружаемая в CAT-систему, которая может состоять из одного слова или одного предложения, отделённая от остальных сегментов знаком препинания или разрывом строки в тексте.
Строить и обучать собственный движок нужно в случаях, если:
Задачи и их решения могут совершенно разными. Свяжитесь с нами, и мы предложим для вас опимальный вариант.