Закрыть
Профориентация: как я стала онтоинженером... а потом перестала
06.06.2016

Профориентация: как я стала онтоинженером... а потом перестала

Автор: Даша Рыбина, штатный редактор SNCMedia
Фото: пресс-центр ABBYY  
Нет времени на весь текст?
ЧИТАЙТЕ СПОЙЛЕР

Даша, как ежик в тумане, ходит по крутому офису ABBYY и пытается понять про семантико-синтаксические деревья. С деревьями так себе, но кормят вкусно и все веселые.

Обсудить статью
читайте также
Алена Корякина, Рамблер/Путешествия: «Мы знаем про туризм всё» Российская сборная: кого возьмут на работу в лучший ресторан? 10 минусов многозадачности Три самых частых «стопа» на пути к любимому делу 6 вещей, которые нужно знать, чтобы выжить в женском коллективе 10 невредных советов для тех, кто мечтает попасть в глянец Лукбук Louis Vuitton весна-лето 2016, снятый за стеклом 8 Instagram-аккаунтов, которые взбодрят вашу карьеру Почему я вернулась в Россию из... Франции, Германии и еще пары стран? Кроссовки – новые лодочки, и как нам теперь с этим жить Дресс-код на машиностроительном заводе: 6 селфи в рабочем туалете Лайфхак: как превратить хобби в бизнес и не растерять энтузиазм на определенной ступени Как стать тревел-журналистом: Париж Вопрос психологу: что делать с детьми моего мужчины? Работать с 9 утра очень вредно На одну зарплату: 45 тысяч рублей Как разрешить себе стать блогером Как одеться на собеседование, если вам не впервой И снова о главном: «Можно ли изменить своего мужчину?» На одну зарплату: 50-60 тысяч Как найти работу в кризис: 7 советов от рекрутера Дресс-код ведущего инженера (в юбке): 5 селфи в рабочем туалете Если Трамп победит: как люди по всему миру наобещали слишком много 10 интересных признаний звездного телохранителя Вопрос психологу: выкинуть бывшего из головы или помириться? Как руководить мужским коллективом, если вы – женщина? Дневник безработного главреда. Часть 1 8 советов, как совмещать работу и здоровые привычки Ликбез: лучшие архитекторы Москвы 7 глупых убеждений, которые мешают вашему счастью

Редакция SNCmedia продолжает проект «Попробуй новую профессию на один день». На этот раз редактор Даша Рыбина отправилась в компанию ABBYY пробовать работу онтоинженера. Кто такой онтоинженер? Вот и Даша не знала, ха-ха.

Итак, я еду в компанию ABBYY, чтобы проверить: правда ли работа онтоинженера – это работа моей мечты. Именно эта профессия будущего выпала мне, когда я прошла тест «Профессии будущей Москвы» на сайте «Профилум». Из общего описания я поняла только, что это что-то очень умное на стыке информатики, искусственного интеллекта, теоретической лингвистики и даже немного философии. Лингвистику я всегда любила, да и вообще – ну сами видите – всю жизнь работаю с языком. Вот я и решила попробовать (раз уж работа генетического консультанта досталась Ане).

О дивный новый мир

Если мои представления о работе онтоинженера были несколько смутными, то про компанию ABBYY я все же знала побольше. Это как-никак гордость отечества – российская IT-корпорация, основанная еще 26 лет назад и давно уже вышедшая на мировой уровень. Даже если вы далеки от компьютеров и программирования, вам наверняка знакомы такие опции, как электронный словарь ABBYY Lingvo и распознаватель текста ABBYY FineReader. Еще я знала, что в ABBYY работают не только программисты, но и лингвисты – за последние годы там оказалось немало моих знакомых и даже однокашников. Ну а благодаря последнему пункту я была в курсе: у этой компании отличный офис, как модно нынче в IT-сфере – со всеми удобствами и радостями для сотрудников, от комфортных рабочих мест до всяческих бонусов и плюшек, чтобы люди не только вкалывали до седьмого пота, но и могли расслабиться и отдохнуть. Вот на офис мечты посмотреть особенно хотелось: можно ли в реальной современной жизни совмещать серьезную работу, досуг, здоровый образ жизни; как руководство помогает своим работникам на этом пути и даже стимулирует их.

Ехать пришлось далеко: тот самый хваленый головной офис ABBYY расположен на станции метро «Отрадное». По дороге от метро пришлось еще и поблуждать между промзонами, парковками и прочими не очень отрадными заборами. Но когда я наконец нахожу правильную проходную, понимаю, дальше уже не заблудишься: вливаюсь в поток идущих на работу неформально одетых тружеников IT-сферы, который и выносит меня к большому красному логотипу компании. Рядом – симпатичная (и заполненная под завязку) велопарковка. Ага, вот и подтверждение: здоровый образ жизни тут в почете не только на словах.

Главный офис ABBY: вход.

Главный офис ABBY: вход.

Здесь же и главный вход; в офисе ABBYY семь этажей, и на каждом сидит куча веселых, счастливых, здоровых, культурных и жизнерадостных компьютерщиков обоего пола. Всего в этом здании работает около 800 человек (не то чтобы я их всех посчитала сама – это мне рассказали сотрудники компании, которые как раз и встретили меня на ресепшн).

Головной офис ABBYY: ресепшн.

Головной офис ABBYY: ресепшн.

Меня знакомят с заместителем директора ABBYY по разработке технологий Татьяной Даниэлян, которой предстоит быть сегодня моим начальником, и с онтоинженером Марией Степановой – Маша будет моим ментором и наставником.

Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY.

Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY.

Прежде всего девушки пытаются меня, так сказать, отговорить. Объясняют, что стать онтоинженером непросто: приходят на эту должность программисты и компьютерные лингвисты, но и им еще нужно обучаться 2 месяца и потом сдавать экзамены. А я-то думала, я такая умничка, что все могу освоить...

Татьяна и Маша садятся со мной в большой и светлой переговорной «У дона», названной, как выясняется, не в честь реки Дон, а в честь дона из игры в мафию – ну дон Корлеоне, знаете, все такое (оказывается, и руководство, и рядовые сотрудники компании регулярно играют в «Мафию», – вау, мы точно подружимся!). 

Переговорная «У Дона».

Переговорная «У Дона».

Но в мафию пока играть не предлагают, а показывают большую презентацию и подробно рассказывают про всё, ради чего я, собственно, сюда и пришла. Для начала – про технологии искусственного интеллекта, про компьютерную лингвистику и, наконец, про то, чем же занимаются эти загадочные онтоинженеры.

Инженеры сущностей

Само понятие «онтология» пришло в информатику и компьютерную лингвистику из философии. Но если у философов «онтология» – это учение о сущем, наука о бытии вообще (ой, мама...), то компьютерщикам все эти дебри сами по себе не нужны: они заморачиваются такими штуками только ради практической необходимости. В информатике онтология – это попытка всеобъемлющей формализации какой-нибудь области знаний; в ней прописаны все объекты и связи между ними, их система и классификация. Ну а онтоинженер (или инженер по знаниям) – это как раз тот, кто превращает знания о реальном мире в эту всеобъемлющую систему-классификацию объектов – и умеет работать с ней.

Каких объектов, для чего – вот это как раз мой следующий вопрос (чувствую себя немножко ежиком в тумане). Ответ на него – очень практичный: в ABBYY не занимаются оторванной от жизни теоретической наукой, а разрабатывают прикладные продукты, востребованные на рынке.

Заветное название – ABBYY Compreno. Это технология понимания и анализа текстов на естественных языках (сейчас – на русском и английском, в разработке – немецкий). Разрабатывая эту программу и расширяя ее возможности, онтоинженеры фактически решают задачу искусственного интеллекта: учат компьютер понимать смысл текста. На базе Compreno создаются решения для бизнеса, для компаний и корпораций. Эти решения позволяют упростить и оптимизировать работу с большими массивами документов: например, проводить анализ и извлекать важные объекты и факты, классифицировать документы, расширять возможности корпоративных поисковых систем. 

Все эти штуки очень сложно делать «ручками», если, например, в архиве вашей конторы каждый день появляются сотни или тысячи новых документов, а Compreno сделает это автоматически. Но до того, как программа будет готова работать именно с вашими документами и решать ваши специфические задачи, ее надо подготовить, а это означает как раз очень большой объем той самой ручной работы. Вот ее-то и выполняют онтоинженеры под потребности каждого конкретного заказчика. 

Принцип Микеланджело

Это, если что, была понятная часть, дальше будет сложнее. Итак, Compreno – это технология семантико-синтаксического анализа текста, основанного на языковой модели и на статистических данных. Синтаксический анализ – это, извините, разбор по членам предложения, подлежащее-сказуемое, это мы в школе учили. Семантический – это следующий уровень, смысловой. В базе данных Compreno описаны и сложены в семантическую иерархию значения слов разных языков. Эта семантическая иерархия не привязана к конкретному языку, она состоит из понятий, которые есть в каждом языке. Сейчас в системе 145 000 таких понятий. Мне показывают вот такую картинку:

И я начинаю понимать, как все запущено: до третьего уровня я вроде все понимаю (хотя на третьем уже плаваю), а вот выше – темный лес. Дальше было еще более сурово. Пытаясь разобраться постфактум, читаю блог ABBYY на «Хабрахабре». Узнаю там, например, что парсер (семантический анализатор) Compreno настолько прокачанный, что способен отличить травку, которая на газоне (семантический класс «grass»), от той травки, о которой вы сейчас подумали (семантический класс «marijuana»). Кстати, да, семантические классы и иерархические отношения между ними называются по-английски – так принято во всем мире.

Или вот еще красивый пример про то, как семантическая глубина анализа помогает парсеру Compreno снимать неоднозначность:

Семантико-синтаксический анализ фразы «зеленые ели».

Семантико-синтаксический анализ фразы «зеленые ели».

«Зеленые ели» – фраза неоднозначная: два зеленых человечка (или деятеля Greenpeace?) принимали пищу? Или имеются в виду хвойные деревья? Compreno анализирует текст по принципу Микеланджело: берет все возможное, а затем постепенно отсекает лишнее. Сначала проверяется морфология – какими формами от каких слов, в каком роде, числе, падеже могут в принципе быть слова «зеленые» и «ели». Идем в семантическую иерархию и смотрим, в каких значениях есть такие слова (GREEN, ENVIRONMENTALIST, FIR, TO_EAT). Дальше программа смотрит все возможные грамматические и семантические связи между ними, отсекает несовместимые формы, после этого строит семантико-синтаксические структуры. С помощью целого ряда статистических оценок в размеченных корпусах текстов выбирается структура-«победитель». На финальном этапе все признаки исходного языках удаляются, остается только смысловая структура с семантическими связями и универсальными понятиями иерархии в качестве узлов. (И это, если что, не перевод на английский, – это перевод на универсальный мета-язык.) Все это делает умная компьютерная программа без участия человека. Но чтобы она была способна различать такие тонкости, требуется много предварительной ручной работы онтоинженеров.

А вот эта штука – разбор фразы «Программист написал плохой код»:

Эта красота – семантико-синтаксическое дерево (хотя мне показалось больше похоже на водоросли). Зеленый текст капслоком – это те самые надъязыковые семантические классы, которые выбираются для каждого слова в универсальной семантической иерархии Compreno – огромном дереве понятий.

В общем, здесь не верят в универсальную грамматику, но верят в универсальную семантику. И вот такими карточками, как эта, с деревьями-водорослями, и заполнен день онтоинженера. Онтоинженеров в ABBYY сейчас семь. Мне объясняют, что на этой должности очень важно иметь творческое мышление, ведь от клиентов может прийти самый неожиданный запрос, связанный с любой предметной областью, для которой на универсальном дереве понятий понадобится выращивать ветки с новой лексикой.

Дальше меня сажают подмастерьем к онтоинженеру Маше Степановой. Я пытаюсь хотя бы немного помочь ей в ее нелегком труде с разметкой текстов, «выращиванием» семантико-синтаксических деревьев и прочей красотой. «Очищенные философские сущности, оторванные от естественного языка, – утешаю я себя, – это же так интересно, так необычно! А что если попробовать думать на мета-языке?... Эй, соберись, ты же всегда любила лингвистику!» Но получается не очень – как-то все это оказалось для меня тяжеловато. Похоже, моя любовь к лингвистике устроена как-то по-другому – как по анекдоту про помидоры: «Кушать люблю, а так – нет».

Офис мечты

Но, к счастью, за мной приходит PR-менеджер ABBYY Татьяна Поташева и устраивает мне экскурсию по офису. И вот ради этого, скажу я вам, стоило сюда приехать и погрузиться в семантические деревья! Офис у них обалденный. Практически на всех этажах и во всех отделах сотрудники сидят вот в таких кубиклах:

Отсеки разработчиков и лингвистов.

Отсеки разработчиков и лингвистов.

На каждом этаже есть зоны отдыха, причем оформленные в разном стиле. Вот, например, японская:

Комната отдыха в японском стиле.

Комната отдыха в японском стиле.

А вот – в стиле парижского кафе:

Парижский холл.

Парижский холл.

А это – зона с обоями для раскрашивания. Очень полезно для релаксации и психологической разгрузки!

Обои для рисования.

Обои для рисования.

И совсем уж в восторг я пришла, когда увидела комнату для детей сотрудников: 

Комната для детей сотрудников.

Комната для детей сотрудников.

Сюда работающие мамы и папы могут привести своих нежных птенчиков разных возрастов, за детьми присмотрят воспитатели. Правда, малышей тут не укладывают спать на тихий час, да и сводить ребенка пообедать в столовую родителям придется самостоятельно. Но все равно – какое же это подспорье! Ведь сюда привозят даже малышей, которые еще не ходят в детский сад (утром я как раз видела у велопарковки, как какой-то папа приехал на работу с маленькой дочерью в велокресле – мимими!), или, например, младших школьников – сейчас, летом, когда учеба уже закончилась. Мне кажется, такой уровень заботы о сотрудниках и их семьях – это сразу огромный бонус в карму компании.

В коридоре встречаем нескольких лингвистов и программистов, бегущих на занятия по акробатике. В офисе есть свой спортивный зал и зал с тренажерами, здесь проводятся разные занятия – спорт, танцы, йога. Вообще вся их культурно-физкультурная жизнь (так и захотелось сказать «внеклассная деятельность»!) очень напомнила мне не только модные IT-офисы Кремниевой долины, но и стиль жизни советских ученых и инженеров годов эдак 1970-х – читающих журнал «Новый мир» и спорящих о свежепрочитанном романе, ходящих в походы и поющих у костра под расстроенную гитару «Милая моя, солнышко лесное». В общем, немножко повеяло миром братьев Стругацких.

И, наконец, моя страсть – столовка! Для меня наличие хорошей столовой или кафе – один из главных аргументов при выборе места работы. Да и время как раз обеденное, поэтому Таня показывает мне и симпатичное кафе Артемия Лебедева на шестом этаже, и большую столовую на первом. Я попила кофе в кафе, как следует пообедала в столовой и готова была сказать «Берем!» – в смысле, работу такую берем.

Как жаль, что работа – это не только комфортный современный офис, вкусная еда и много симпатичных программистов вокруг! В общем, эксперимент показал, что никакой я не онтоинженер. Эта работа – кропотливая, сложная, требует постоянного внимания, а мои основные навыки и таланты в ней, похоже, остаются невостребованными. Ну и если мне вдруг не будет хватать нагрузки на глаза от постоянной работы за компьютером, я всегда могу поразвлекаться с html-кодами в админке нашего сайта... Так что остаюсь работать с языком в том смысле, в каком и работала: без семантических деревьев и перехода на мета-уровень. Хотя поиграть в «Мафию» я сюда бы еще с удовольствием пришла! 

Спасибо Татьяне Даниэлян, Марии Степановой и Татьяне Поташевой за интересный рассказ и за то, что потратили на меня так много своего рабочего времени, компании ABBYY за то, что вы придумали, чем полезным занять лингвистов помимо академической науки, сервису «Профилум» за то, что позволили мне лучше узнать свои сильные и слабые стороны, и «Агентству инноваций города Москвы» за «Профессии будущей Москвы». 

Как вам работа онтоинженера?

ЧИТАТЬ ТАКЖЕ

Певица авангардно выглядит в образе космической зебры. Верните на место платье шальной императрицы, к нему мы уже хотя бы привыкли.
новые trashsetter’ы
Что вам надо на самом деле, когда хочется съесть (или выпить) чего-нибудь вредного
2 часа назад
Что вам надо на самом деле, когда хочется съесть (или выпить) чего-нибудь вредного
Наконец-то! В том, что хочется булочку, чипсы или выпить, нашлось хоть что-то полезное. Оказывается, таким образом организм подает нам сигналы о том, что ему на самом деле нужно (увы, не булочку, чипсы и выпить). Рассказываем что же.
Самые бредовые прически на Рождество
3 часа назад
Самые бредовые прически на Рождество
Все мы прожили непростое детство под присмотром мастериц-воспиталок в саду, которые в долгие часы досуга плели из наших длинных волос косы, корзинки и прочую чепуху. Можно лишь глубоко вздохнуть, глядя на этих американских деток, в основном становящихся жертвами домашних плетений своих родственников в канун праздников. 
Сколько стоит: взять машину напрокат
4 часа назад
Сколько стоит: взять машину напрокат
Каршеринговый бизнес уже давно развит в Европе и Северной Америке, мы к нему пока только привыкаем и притираемся. Если услугами такси хоть пару раз пользовалась каждая первая из нас («с руки» бомбил по пути из клуба точно ловили все), то как без ключа открыть припаркованную машину и уехать на ней, знает далеко не каждая. Мы расскажем, как это сделать, и главное, сколько это стоило основательницам BelkaCar – Екатерине Макаровой, Лориане Сардар и Елене Мурадовой.
Вещи с историей… бабушкины вазы и дедушкино кресло в современном интерьере
4 часа назад
Вещи с историей… бабушкины вазы и дедушкино кресло в современном интерьере
Дизайн интерьеров дает карт-бланш на возвращение в стильные жилые пространства винтажных предметов, которые вы чуть было не убрали на вечное хранение или не продали на avito. Партнеры архитектурной студии dvekati Катя Сванидзе и Катя Любарская показали, как умело вписать семейные реликвии и артефакты с барахолки в современный интерьер, а заодно рассказали интересные истории о них.
Йен Сомерхолдер и его 9 женщин
5 часов назад
Йен Сомерхолдер и его 9 женщин
Сегодня одному из самых сексуальных экранных вампиров исполняется 38 лет. Сколько женщин успел покорить этот голубоглазый красавчик?
Гороскоп Овен
(21.03 - 20.04)
Общий прогноз на 5–11 декабря
Вас ждет очень продуктивная и удачная неделя. Все жесткие аспекты, которые подталкивали и даже принуждали вас к действиям, расходятся.