Закрыть
Профориентация: как я стала онтоинженером... а потом перестала
06.06.2016

Профориентация: как я стала онтоинженером... а потом перестала

Автор: Даша Рыбина , штатный редактор SNCMedia
Фото: пресс-центр ABBYY  
Нет времени на весь текст?
ЧИТАЙТЕ СПОЙЛЕР

Даша, как ежик в тумане, ходит по крутому офису ABBYY и пытается понять про семантико-синтаксические деревья. С деревьями так себе, но кормят вкусно и все веселые.

Обсудить статью
читайте также
Есть че? Как правильно попросить прибавку к зарплате Дресс-код в московском кафе: 5 селфи в рабочем туалете 8 секретов продуктивных людей Дресс-код в кинокомпании: 5 селфи в рабочем туалете Специально для трудоголиков: как не сгореть на работе окончательно Женщины и технологии: три успешных стартапа Жених предъявил мне ультиматум. Как быть? Словарь SNC: язык пиарщиков Послы доброй воли: зачем волонтеры работают на Mercedes-Benz Fashion Week Russia Дресс-код онлайн: 5 селфи в рабочем туалете Как управлять коллективом, в котором все старше вас? Дорогая, я увеличил себе... ноги! Мужчина о пластической операции Ассистент Валерия Тодоровского о своих обязанностях и планах Самые красивые образы последних круизных коллекций по версии SNCmedia «Фешен из май профэшн»: как работают в индустрии моды у нас и на Западе Как вернуться к работе после праздников, собрать свои мозги и перестать тупить Рейтинг: лучшие российские холостяки-финансисты. Часть вторая Дресс-код в строительной компании: 3 селфи в офисном туалете Вся правда о моделях: гречка, кастинги, диеты Хештег недели: #WorkLifeBalance 4 отвратительных босса, рядом с которыми возможно выжить «Я не нравлюсь его друзьям!» Комментирует психолог 7 способов попрощаться с боссом (и 14 вариантов последствий) Как понять, что пора валить, и сделать это грамотно Хештег недели: #FirstSevenJobs «Инстаграм» в «Инстаграме»: зачем нужны «сториз» и почему мы видим фотки незнакомцев 7 звездных признаний о карьерных провалах Не все потеряно: 9 миллиардеров, которые росли в нищете Интервью Ксении Собчак с первым вице-президентом ACMG Антонио Алицци Ангелина Дорошенкова: «Я не перестану сниматься в порно просто потому, что меня осуждают»

Редакция SNCmedia продолжает проект «Попробуй новую профессию на один день». На этот раз редактор Даша Рыбина отправилась в компанию ABBYY пробовать работу онтоинженера. Кто такой онтоинженер? Вот и Даша не знала, ха-ха.

Итак, я еду в компанию ABBYY, чтобы проверить: правда ли работа онтоинженера – это работа моей мечты. Именно эта профессия будущего выпала мне, когда я прошла тест «Профессии будущей Москвы» на сайте «Профилум». Из общего описания я поняла только, что это что-то очень умное на стыке информатики, искусственного интеллекта, теоретической лингвистики и даже немного философии. Лингвистику я всегда любила, да и вообще – ну сами видите – всю жизнь работаю с языком. Вот я и решила попробовать (раз уж работа генетического консультанта досталась Ане).

О дивный новый мир

Если мои представления о работе онтоинженера были несколько смутными, то про компанию ABBYY я все же знала побольше. Это как-никак гордость отечества – российская IT-корпорация, основанная еще 26 лет назад и давно уже вышедшая на мировой уровень. Даже если вы далеки от компьютеров и программирования, вам наверняка знакомы такие опции, как электронный словарь ABBYY Lingvo и распознаватель текста ABBYY FineReader. Еще я знала, что в ABBYY работают не только программисты, но и лингвисты – за последние годы там оказалось немало моих знакомых и даже однокашников. Ну а благодаря последнему пункту я была в курсе: у этой компании отличный офис, как модно нынче в IT-сфере – со всеми удобствами и радостями для сотрудников, от комфортных рабочих мест до всяческих бонусов и плюшек, чтобы люди не только вкалывали до седьмого пота, но и могли расслабиться и отдохнуть. Вот на офис мечты посмотреть особенно хотелось: можно ли в реальной современной жизни совмещать серьезную работу, досуг, здоровый образ жизни; как руководство помогает своим работникам на этом пути и даже стимулирует их.

Ехать пришлось далеко: тот самый хваленый головной офис ABBYY расположен на станции метро «Отрадное». По дороге от метро пришлось еще и поблуждать между промзонами, парковками и прочими не очень отрадными заборами. Но когда я наконец нахожу правильную проходную, понимаю, дальше уже не заблудишься: вливаюсь в поток идущих на работу неформально одетых тружеников IT-сферы, который и выносит меня к большому красному логотипу компании. Рядом – симпатичная (и заполненная под завязку) велопарковка. Ага, вот и подтверждение: здоровый образ жизни тут в почете не только на словах.

Главный офис ABBY: вход.

Главный офис ABBY: вход.

Здесь же и главный вход; в офисе ABBYY семь этажей, и на каждом сидит куча веселых, счастливых, здоровых, культурных и жизнерадостных компьютерщиков обоего пола. Всего в этом здании работает около 800 человек (не то чтобы я их всех посчитала сама – это мне рассказали сотрудники компании, которые как раз и встретили меня на ресепшн).

Головной офис ABBYY: ресепшн.

Головной офис ABBYY: ресепшн.

Меня знакомят с заместителем директора ABBYY по разработке технологий Татьяной Даниэлян, которой предстоит быть сегодня моим начальником, и с онтоинженером Марией Степановой – Маша будет моим ментором и наставником.

Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY.

Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY.

Прежде всего девушки пытаются меня, так сказать, отговорить. Объясняют, что стать онтоинженером непросто: приходят на эту должность программисты и компьютерные лингвисты, но и им еще нужно обучаться 2 месяца и потом сдавать экзамены. А я-то думала, я такая умничка, что все могу освоить...

Татьяна и Маша садятся со мной в большой и светлой переговорной «У дона», названной, как выясняется, не в честь реки Дон, а в честь дона из игры в мафию – ну дон Корлеоне, знаете, все такое (оказывается, и руководство, и рядовые сотрудники компании регулярно играют в «Мафию», – вау, мы точно подружимся!). 

Переговорная «У Дона».

Переговорная «У Дона».

Но в мафию пока играть не предлагают, а показывают большую презентацию и подробно рассказывают про всё, ради чего я, собственно, сюда и пришла. Для начала – про технологии искусственного интеллекта, про компьютерную лингвистику и, наконец, про то, чем же занимаются эти загадочные онтоинженеры.

Инженеры сущностей

Само понятие «онтология» пришло в информатику и компьютерную лингвистику из философии. Но если у философов «онтология» – это учение о сущем, наука о бытии вообще (ой, мама...), то компьютерщикам все эти дебри сами по себе не нужны: они заморачиваются такими штуками только ради практической необходимости. В информатике онтология – это попытка всеобъемлющей формализации какой-нибудь области знаний; в ней прописаны все объекты и связи между ними, их система и классификация. Ну а онтоинженер (или инженер по знаниям) – это как раз тот, кто превращает знания о реальном мире в эту всеобъемлющую систему-классификацию объектов – и умеет работать с ней.

Каких объектов, для чего – вот это как раз мой следующий вопрос (чувствую себя немножко ежиком в тумане). Ответ на него – очень практичный: в ABBYY не занимаются оторванной от жизни теоретической наукой, а разрабатывают прикладные продукты, востребованные на рынке.

Заветное название – ABBYY Compreno. Это технология понимания и анализа текстов на естественных языках (сейчас – на русском и английском, в разработке – немецкий). Разрабатывая эту программу и расширяя ее возможности, онтоинженеры фактически решают задачу искусственного интеллекта: учат компьютер понимать смысл текста. На базе Compreno создаются решения для бизнеса, для компаний и корпораций. Эти решения позволяют упростить и оптимизировать работу с большими массивами документов: например, проводить анализ и извлекать важные объекты и факты, классифицировать документы, расширять возможности корпоративных поисковых систем. 

Все эти штуки очень сложно делать «ручками», если, например, в архиве вашей конторы каждый день появляются сотни или тысячи новых документов, а Compreno сделает это автоматически. Но до того, как программа будет готова работать именно с вашими документами и решать ваши специфические задачи, ее надо подготовить, а это означает как раз очень большой объем той самой ручной работы. Вот ее-то и выполняют онтоинженеры под потребности каждого конкретного заказчика. 

Принцип Микеланджело

Это, если что, была понятная часть, дальше будет сложнее. Итак, Compreno – это технология семантико-синтаксического анализа текста, основанного на языковой модели и на статистических данных. Синтаксический анализ – это, извините, разбор по членам предложения, подлежащее-сказуемое, это мы в школе учили. Семантический – это следующий уровень, смысловой. В базе данных Compreno описаны и сложены в семантическую иерархию значения слов разных языков. Эта семантическая иерархия не привязана к конкретному языку, она состоит из понятий, которые есть в каждом языке. Сейчас в системе 145 000 таких понятий. Мне показывают вот такую картинку:

И я начинаю понимать, как все запущено: до третьего уровня я вроде все понимаю (хотя на третьем уже плаваю), а вот выше – темный лес. Дальше было еще более сурово. Пытаясь разобраться постфактум, читаю блог ABBYY на «Хабрахабре». Узнаю там, например, что парсер (семантический анализатор) Compreno настолько прокачанный, что способен отличить травку, которая на газоне (семантический класс «grass»), от той травки, о которой вы сейчас подумали (семантический класс «marijuana»). Кстати, да, семантические классы и иерархические отношения между ними называются по-английски – так принято во всем мире.

Или вот еще красивый пример про то, как семантическая глубина анализа помогает парсеру Compreno снимать неоднозначность:

Семантико-синтаксический анализ фразы «зеленые ели».

Семантико-синтаксический анализ фразы «зеленые ели».

«Зеленые ели» – фраза неоднозначная: два зеленых человечка (или деятеля Greenpeace?) принимали пищу? Или имеются в виду хвойные деревья? Compreno анализирует текст по принципу Микеланджело: берет все возможное, а затем постепенно отсекает лишнее. Сначала проверяется морфология – какими формами от каких слов, в каком роде, числе, падеже могут в принципе быть слова «зеленые» и «ели». Идем в семантическую иерархию и смотрим, в каких значениях есть такие слова (GREEN, ENVIRONMENTALIST, FIR, TO_EAT). Дальше программа смотрит все возможные грамматические и семантические связи между ними, отсекает несовместимые формы, после этого строит семантико-синтаксические структуры. С помощью целого ряда статистических оценок в размеченных корпусах текстов выбирается структура-«победитель». На финальном этапе все признаки исходного языках удаляются, остается только смысловая структура с семантическими связями и универсальными понятиями иерархии в качестве узлов. (И это, если что, не перевод на английский, – это перевод на универсальный мета-язык.) Все это делает умная компьютерная программа без участия человека. Но чтобы она была способна различать такие тонкости, требуется много предварительной ручной работы онтоинженеров.

А вот эта штука – разбор фразы «Программист написал плохой код»:

Эта красота – семантико-синтаксическое дерево (хотя мне показалось больше похоже на водоросли). Зеленый текст капслоком – это те самые надъязыковые семантические классы, которые выбираются для каждого слова в универсальной семантической иерархии Compreno – огромном дереве понятий.

В общем, здесь не верят в универсальную грамматику, но верят в универсальную семантику. И вот такими карточками, как эта, с деревьями-водорослями, и заполнен день онтоинженера. Онтоинженеров в ABBYY сейчас семь. Мне объясняют, что на этой должности очень важно иметь творческое мышление, ведь от клиентов может прийти самый неожиданный запрос, связанный с любой предметной областью, для которой на универсальном дереве понятий понадобится выращивать ветки с новой лексикой.

Дальше меня сажают подмастерьем к онтоинженеру Маше Степановой. Я пытаюсь хотя бы немного помочь ей в ее нелегком труде с разметкой текстов, «выращиванием» семантико-синтаксических деревьев и прочей красотой. «Очищенные философские сущности, оторванные от естественного языка, – утешаю я себя, – это же так интересно, так необычно! А что если попробовать думать на мета-языке?... Эй, соберись, ты же всегда любила лингвистику!» Но получается не очень – как-то все это оказалось для меня тяжеловато. Похоже, моя любовь к лингвистике устроена как-то по-другому – как по анекдоту про помидоры: «Кушать люблю, а так – нет».

Офис мечты

Но, к счастью, за мной приходит PR-менеджер ABBYY Татьяна Поташева и устраивает мне экскурсию по офису. И вот ради этого, скажу я вам, стоило сюда приехать и погрузиться в семантические деревья! Офис у них обалденный. Практически на всех этажах и во всех отделах сотрудники сидят вот в таких кубиклах:

Отсеки разработчиков и лингвистов.

Отсеки разработчиков и лингвистов.

На каждом этаже есть зоны отдыха, причем оформленные в разном стиле. Вот, например, японская:

Комната отдыха в японском стиле.

Комната отдыха в японском стиле.

А вот – в стиле парижского кафе:

Парижский холл.

Парижский холл.

А это – зона с обоями для раскрашивания. Очень полезно для релаксации и психологической разгрузки!

Обои для рисования.

Обои для рисования.

И совсем уж в восторг я пришла, когда увидела комнату для детей сотрудников: 

Комната для детей сотрудников.

Комната для детей сотрудников.

Сюда работающие мамы и папы могут привести своих нежных птенчиков разных возрастов, за детьми присмотрят воспитатели. Правда, малышей тут не укладывают спать на тихий час, да и сводить ребенка пообедать в столовую родителям придется самостоятельно. Но все равно – какое же это подспорье! Ведь сюда привозят даже малышей, которые еще не ходят в детский сад (утром я как раз видела у велопарковки, как какой-то папа приехал на работу с маленькой дочерью в велокресле – мимими!), или, например, младших школьников – сейчас, летом, когда учеба уже закончилась. Мне кажется, такой уровень заботы о сотрудниках и их семьях – это сразу огромный бонус в карму компании.

В коридоре встречаем нескольких лингвистов и программистов, бегущих на занятия по акробатике. В офисе есть свой спортивный зал и зал с тренажерами, здесь проводятся разные занятия – спорт, танцы, йога. Вообще вся их культурно-физкультурная жизнь (так и захотелось сказать «внеклассная деятельность»!) очень напомнила мне не только модные IT-офисы Кремниевой долины, но и стиль жизни советских ученых и инженеров годов эдак 1970-х – читающих журнал «Новый мир» и спорящих о свежепрочитанном романе, ходящих в походы и поющих у костра под расстроенную гитару «Милая моя, солнышко лесное». В общем, немножко повеяло миром братьев Стругацких.

И, наконец, моя страсть – столовка! Для меня наличие хорошей столовой или кафе – один из главных аргументов при выборе места работы. Да и время как раз обеденное, поэтому Таня показывает мне и симпатичное кафе Артемия Лебедева на шестом этаже, и большую столовую на первом. Я попила кофе в кафе, как следует пообедала в столовой и готова была сказать «Берем!» – в смысле, работу такую берем.

Как жаль, что работа – это не только комфортный современный офис, вкусная еда и много симпатичных программистов вокруг! В общем, эксперимент показал, что никакой я не онтоинженер. Эта работа – кропотливая, сложная, требует постоянного внимания, а мои основные навыки и таланты в ней, похоже, остаются невостребованными. Ну и если мне вдруг не будет хватать нагрузки на глаза от постоянной работы за компьютером, я всегда могу поразвлекаться с html-кодами в админке нашего сайта... Так что остаюсь работать с языком в том смысле, в каком и работала: без семантических деревьев и перехода на мета-уровень. Хотя поиграть в «Мафию» я сюда бы еще с удовольствием пришла! 

Спасибо Татьяне Даниэлян, Марии Степановой и Татьяне Поташевой за интересный рассказ и за то, что потратили на меня так много своего рабочего времени, компании ABBYY за то, что вы придумали, чем полезным занять лингвистов помимо академической науки, сервису «Профилум» за то, что позволили мне лучше узнать свои сильные и слабые стороны, и «Агентству инноваций города Москвы» за «Профессии будущей Москвы». 

Как вам работа онтоинженера?

ЧИТАТЬ ТАКЖЕ

Эти горошки как будто сошли со страниц журнала «Работница» классического периода, когда дородные модели в ситцевых сарафанах позировали среди берез. Простодушное сочетание белых горошков c белыми же бусами и поясом тоже откуда-то из наивного прошлого.
новые trashsetter’ы
План-схема SNC: улица Правды
9 часов назад
План-схема SNC: улица Правды
Местами улица Правды – такая же лживая, как прописавшаяся тут советская пропаганда. Под одной вывеской днем – кафе для мамочек, а вечером – лютый тверк.
Модная съемка: «Выездная сессия»
12 часов назад
Модная съемка: «Выездная сессия»
Готовиться к экзаменам вуза, скажем честно, скучно. Мудрые студентки делают это с видом на горы и в эффектнейшем нижнем белье.
Практика: румяна на пол-лица
13 часов назад
Практика: румяна на пол-лица
От души нарумяненные щеки – непременное условие модного макияжа версии весна-лето 2017.
Может, это любовь: 7 фильмов о желанных зрителями романах
24 февраля 2017
Может, это любовь: 7 фильмов о желанных зрителями романах
Иногда то, что между главными героями закрутится роман, очевидно с первых же кадров. Но есть такие фильмы, в которых зритель до последнего гадает, будут ли они вместе. Обычно хэппи-энда не происходит, а ведь так хочется!
Обещанного три года ждут: коллаборации, которые все хотят
24 февраля 2017
Обещанного три года ждут: коллаборации, которые все хотят
Чуть только поутихли не только охи, но и вздохи по поводу смелого реверанса креативного директора Louis Vuitton Николя Жескье Джеймсу Джеббиа и параллельной вселенной, построенной его главным детищем, синонимичным стритстайлу брендом Supreme, настало время активно подкармливать свинью-копилку обещаниями наэкономить на очередную дизайнерскую коллаборацию. Уже имеющиеся в гардеробе объекты поклонения от Джиджи для «Хилфигера», Рианны для «Пумы», Вэнга для «Адидас», с помпой перезапускающиеся в этом году, не в счет. Получите-распишитесь: перед вами дайджест модных коллабораций, которые мы действительно ждем в этом году. За исключением разве что Supreme x Lacoste, которая все еще гуляет в статусе Rumors On The Dance Floor.
Гороскоп Овен
(21.03 - 20.04)
Общий прогноз на 20–26 февраля
Начало недели откроет напряженной аспект между Марсом и Плутоном. Скорее всего, не получится начать рабочий понедельник с плавного утра, спокойной чашечки кофе и размеренных планов. Вам предстоит много работы.