Искусство побеждать. Секреты научной победы Александры Ватьян

Текущая научная деятельность Александры Ватьян, молодого ученого Университета ИТМО, связана с изучением следующего фундаментального вопроса: «Повышение точности диагностики рака легких посредством анализа КТ* изображений с использованием глубокого обучения, а также интеграции разнородной медицинской информации». Разработки ведутся совместно с коллективом ученых под руководством Шалыто Анатолия Абрамовича и Гусаровой Наталии Федоровны.
*Справочная информация: КТ — компьютерная томография.

В финал конкурса вышли лучшие работы претендентов. Среди победителей, которых было более 400 человек, почетное место заняла работа Александры Ватьян. Особое внимание (в рамках научной деятельности) Александра уделила теме: «Онтологическая система хранения результатов исследований по медицинской диагностике», которая и стала победителем гранта Комитета по науке и высшей школе Правительства Санкт-Петербурга.

В конкурсе приняли участие студенты и аспиранты вузов, отраслевых и академических институтов, которые развивают науку по основным номинациям конкурса. Номинаций – пять:

В канун Нового года мы поздравили молодого ученого с победой и взяли интервью.


На фотографии: Александра Ватьян.

Тема работы, с которой Вы приняли участие в конкурсе и победили, звучит несколько иначе, чем основная тема Вашей научной работы. Существует ли взаимосвязь между ними?
Александра Ватьян: Вы отметили верно, что эти две темы связаны между собой. Если мы говорим о медицинских исследованиях, то стоит уточнить, что мы начинали свою работу именно с онтологических исследований и постепенно пришли к медицине. В данный момент есть огромное количество работ на эту тему, в том числе медицинских, и все это, как вы понимаете, находится в интернете, в научных статьях, в разработках, которые хранят сами медики, и, в том числе ученые, которые пытаются между собой общаться. Однако, этой информации огромное количество и ни один человек не в состоянии ее постоянно обрабатывать. Только по раку легких в день публикуется 200 статей. Поэтому необходимо иметь возможность одновременно обрабатывать большие массивы различной информации, содержащие в себе противоречивые данные.

Какая задача стоит перед Вами?
Александра Ватьян: Мы пытаемся объединить между собой некие общие критерии, атрибуты, которые содержатся в различной информации и свести между собой противоречия. Допустим, у нас есть одно исследование, которое говорит о том, что некий алгоритм машинного обучения имеет некую точность диагностики (например, в 70%) при определенных условиях. Другое, второе исследование, говорит об обратном: т.е., тот же самый алгоритм машинного обучения на самом деле плохо обрабатывает данные при тех же самых атрибутах. Эти противоречия мы и пытаемся свести. Поскольку такой информации достаточно много, то наша цель эти противоречия, во-первых, выявлять и как-то их между собой систематизировать; иметь возможность их хранить и к ним обращаться; и, во-вторых, выводить из этого некую значимую константу и информацию.

Представьте, что уже все сделано; все противоречия можно свести. Что будет дальше после этого шага? Какой последующий горизонт Вы наметите для научной работы?
Александра Ватьян: О, такого не будет, такого не бывает. Противоречия не снимутся никогда.
Наталия Федоровна (научный руководитель Александры): Противоречия не снимутся, они будут всегда, но это возможность для конкретного исследователя увидеть интегральную картину целиком. Вот этого не было никогда и это то, что принципиально новое мы делаем. Мы не пытаемся построить единую для всех структуру, которая разрешит все противоречия, - это изначально невозможно. Это тупиковая идея; и эта идея больших классических баз данных здесь совершенно не работает. Нужно, чтобы каждый исследователь, который занимается этой проблемой, и естественно входит в нее как-то сбоку, со своей стороны, со своего взгляда на картину, на проблему целиком, - вот эта «его картина целиком» должна достраиваться теми данными, которые мы получаем из статей. Т.е., мы не пытаемся построить единую для всех картину, по ней работать невозможно; мы пытаемся дать возможность человеку оперативно подгрузить всю информацию, которая ему сейчас интересна, а потом будет интересна другая; и он другую подгрузит, но эту оперативную информацию у него будет возможность внести в единую картину с точки зрения учета противоречий. Тогда ему будет проще их разрешать. Он увидит: дырка здесь, дырка здесь, дырка здесь. Другой человек, на тех же самых данных, увидит другую картинку, потому что у него «иные мозги»; у него уже картина мира другая в этой предметной области, и он будет на нашей же методике строить другую картину мира. И это есть хорошо.


На фотографии (слева направо): Александра Ватьян, Наталья Добренко.

Александра, глядя на ваш график научных публикаций, понимаешь, что у Вас очень насыщенная научная жизнь. Как Вы с этим справляетесь?
Александра Ватьян: Как я с этим справляюсь? Да никак, просто делаю.
Наталья Добренко: Путем решения маленьких задач. Сегодня, например, мы сделаем это, а завтра – другое, и так последовательно, до конца.
Александра Ватьян: Нам приходится «решать проблемы по мере их поступления». На самом деле, - как? Если до этого была индивидуальная работа, и каждую статью я писала сама, были какие-то мои личные наработки совместно с моим научным руководителем, то в данный момент все переросло в проект, над которым работает уже большее количество людей. Каждый человек ответственно делает свою часть статьи, свою часть исследования. Сейчас мы планируем выпустить столько же статей, сколько уже и было опубликовано на данный момент благодаря командной работе за два года.

Сколько человек работает над исследованием?
Александра Ватьян: Основных участников в работе над проектом - трое (я, Наталья Добренко, Наталия Федоровна) под руководством Анатолия Абрамовича Шалыто; общее количество на сегодняшний день - 13 человек.
Наталья Добренко: Каждый разрабатывает какую-то свою часть темы.
Александра Ватьян: Именно так, поскольку тема достаточно объемная. Она делится на две части. Первую мы с вами уже обсудили (о раке легких). Она действительно стоит отдельно. Получается, что у нас в команде кто-то занимается соединением разнородной информации, кто-то - ее обработкой, кто-то - исследованиями различных алгоритмов, а кто-то - улучшением показателей алгоритмов. Другие участники проекта занимаются введением значимой информации и сегментацией медицинских текстов.

Сколько вам потребовалось времени чтобы подготовить документы на грант: от анкеты до подачи заявки?
Александра Ватьян: Нам потребовался один месяц. В это же время мы успели оформить пакеты документов еще для двух других грантов.

Были ли какие-то особенности при подготовке документов, сложности, с которыми пришлось столкнуться?
Александра Ватьян: Мы преодолели большинство сложностей, которые связаны со сбором различных подписей и прохождением разного рода инстанций с точным заполнением всех форм документов. Сама заявка представляет собой документ с описанием проекта, более чем на 20-ти страницах. В заявке важно было подтвердить соответствие тематике.

Кто первый проинформировал Вас об итогах конкурса и поздравил с победой?
Александра Ватьян: Первым проинформировал и поздравил Анатолий Абрамович Шалыто. Это было необычайно радостно и удивительно! Радостно - потому что наша заявка была в числе лучших на конкурсе. А удивительно - потому что было много очень сильных команд, которые уже имели опыт участия в конкурсе, в том числе с Мегафакультета Университета ИТМО.
Наталья Добренко: Во всем мире рак легких является высокорейтинговой проблемой. В связи с этим, на конкурсе был очень высокий показатель по интересу к нашей теме, и мы получили более высокий средний бал. Однако, нас ожидала более скрупулезная проверка адекватности к заявленным результатам. С этим мы успешно справились.

Как долго вы занимаетесь темой рака легких и почему выбрали именно ее для изучения?
Александра Ватьян: Этой темой мы занимаемся 2 года.
Наталья Добренко: Начиная с конца 2015 года. У Александры сначала возникла просто идея в тот момент, когда она поступала в аспирантуру: идея особой системы хранения онтологии.
Александра Ватьян: Да, мы начинали с онтологии, и первой была идея, связанная с возможностью структуризации информации, потом мы как-то плавно перешли от онтологии к медицине.
Наталья Добренко: На логику развития идеи значимое влияние оказал наш научный руководитель Наталия Федоровна, которая как раз в это время с другим аспирантом проводила исследование по раку легких. Мы нашли такую нишу, которая оказалось очень интересной и неизведанной для нас. Она была необычна в том смысле, что можно медицинские данные обрабатывать и получать результаты, выявляя какие-то зависимости. Мы с Александрой в срочном порядке стали в этом вопросе разбираться. Как видите, у нас получилось. 
Александра Ватьян: В 2016 году мы опубликовали 2 статьи по данной теме, а летом 2016 года состоялось выступление на международной конференции DTGS 2016 (Digital Transformation & Global Society) с 22 по 24 июня. Университет ИТМО выступили соорганизатором мероприятия совместно с Университетом Амстердама и Европейским университетом в Санкт-Петербурге. Это выступление и статьи были очень хорошо восприняты. Мы считаем это очень важным достижением. Действительно, внезапно оказалось, что заявленная проблематика достаточно актуальна и интересна в научном сообществе, и у нас получается с этим работать.
Наталия Федоровна: Вопрос раковых заболеваний в нашей действительности касается практически каждой семьи, или почти каждой, или в каждой второй семье есть эта трагедия. Это абсолютно личностная история. Поэтому этим нужно заниматься, потому что люди умирают.

Скажите, какие главные тенденции преобладают в вопросе диагностики рака легких и анализа КТ в настоящее время? 
Анатолий Абрамович: Главная тенденция заключается в том, что в изучении этого вопроса, в этом научном направлении появляется больше исследователей-женщин.
Александра Ватьян: Основной платформой является искусственный интеллект, базирующийся на нейросетях, а тенденцией - что мы движемся к обществу, в котором искусственный интеллект станет независимым от человека и сможет самообучаться.

Человек при общении и взаимодействии с искусственным интеллектом будет партнером, сторонним наблюдателем или другом его развития и деятельности?
Александра Ватьян: Достаточно спорный вопрос: может ли машина выйти за рамки собственного развития, хотя об этом много написано. Мне кажется, что вряд ли человек допустит возможность самообучения машины таким образом, чтобы она смогла быть неуправляема. Во всяком случае, мне всегда так казалось. Это достаточно интересный и сложный вопрос.

Есть ли по теме Ваших исследований какие-либо подобные разработки в России или за рубежом?
Александра Ватьян: Их достаточно много. Они широко распространены и ведутся как у нас в стране, так и за рубежом. Однако, у нас в стране исследований проводится значительно меньше. Большим минусом является то, что, во-первых, у нас медицинские данные очень закрытые. Во-вторых, эти данные не хранятся и не выдаются для свободного исследования и поэтому приходится брать те же самые снимки КТ из международных баз данных. В частности, из Бостонской клиники. Однако, нам удалось найти связи в Санкт-Петербурге и на месте начать решать этот вопрос, наработав связи с медицинскими клиниками, которые выдают нам деперсонализированную информацию и документацию. Это уже те источники, на которые мы можем опираться в своих исследованиях. 

Зарубежные команды могут рассматриваться в рамках Вашей темы как конкуренты?
Александра Ватьян: Да, безусловно могут. В первой части нашего исследования, которое касается рака легких, мы берем как базис соревнования, которые были проведены в прошлом году Kaggle. Это достаточно известная платформа для проведения различных конкурсов. Сильнейшие программисты мира (компетентные в области искусственного интеллекта и нейронных сетей) соревновались там и результаты оказались достаточно неутешительными в 75%. Другими словами, тематика распознавания рака легких на КТ снимках чрезвычайно актуальна. По статистике всемирного консорциума, опытный врач-радиолог распознает и правильно диагностирует опухоль только в 75% случаев. Т.е., в 1 случае из 4 он ошибается. Получается, что нейронная сеть пока ведет себя так же, так же диагностирует и ошибается. Получается, что нейронная сеть вышла в конкретной задаче на уровень человека - опытного специалиста. Двигаться в этом направлении стоит, поскольку очень тяжело распознавать именно маленькие опухоли. Их крайне сложно классифицировать относительно друг друга. Это сложно как математически, так и визуально. Человек должен описать у них неровные концы с неровными нестандартными изгибами, т.е. нельзя сказать, что здесь всегда будет вот так-вот, каждый раз у каждого человека всегда может быть что-нибудь по-другому. Поэтому и машина, и люди в этом вопросе сложно обучаемы.

Какую помощь оказывают Вам студенты по теме рака легких, и кто чем запомнился?
Александра Ватьян: Студенты оказывают очень большую помощь. Часть из них работает над настройками и тренировками этих нейронных сетей. Они делают, модифицируют этапы предпроцессинга, пытаются улучшить атрибуты для улучшения показателей текущих алгоритмов. Часть студентов работает с базами данных, содержащих различные КТ снимки, т.к. они требуют определенной обработки, нормализации. Еще часть студентов пытается свести несколько этих баз в одну для лучшей тренировки нейронной сети. Таким образом, студенты принимают очень активное участие в работе над темой.
Наталья Добренко: Другая группа студентов проводит тематическую сегментацию медицинских текстов для извлечения важной и актуальной информации, с возможностью сохранения противоречивых данных. Т.е., ведется насыщенная, сложная и активная работа.

Какие возможности получают студенты при работе над исследованиями?
Александра Ватьян: Это работа с актуальной темой, с реальными данными, работа с суперкомпьютерами, тогда как эта возможность не предоставляется обычным студентам.

Вне стен вуза, какой Вы человек, что Вас радует, интересует, увлекает?
Наталья Добренко: Если говорить о том, какие мы вне стен вуза, какими мы становимся с нашими родными, с нашими друзьями, то, конечно, стараемся отдыхать, стараемся проводить время со своими близкими, с семьей. Например, сейчас вместе с ребенком мы делали новогоднюю поделку «Снеговика-почтовика» и получили уйму удовольствия. Солнечный день радует. А Наталия Федоровна увлекается тем, что собирает пазлы.
Наталия Федоровна: Да, увлекаюсь. Это релакс, и очень хороший релакс. Всем рекомендую: это отдых с осмыслением. Мы всем составом кафедры любим ходить в Мариинский театр. Мы все очень любим музыку.
Анатолий Абрамович: Вот, я купил 6 билетов на современный балет на Международный Фестиваль «Dance Open», который пройдет в апреле 2018 года. Это искусство, где нельзя обмануть; где видно, какой труд вложен. В прошлом году я видел какую-то совершенно невероятную нидерландскую труппу и восхитился их танцем. В этом году планирую увидеть балеты из других стран в Санкт-Петербурге. Посмотреть это искусство у нас значительно удобнее, чем ездить в каждую отдельную страну Европы, чтобы увидеть там что-нибудь одно.
Александра Ватьян: Меня радует движение вперед в различных его проявлениях и не только в науке. Также нравится проводить время с друзьями и заниматься наукой. В нашем вузе интересно и комфортно. Я занимаюсь любимым делом и общаюсь с потрясающими людьми, с которыми встретиться где-нибудь в другом месте достаточно сложно. Это люди с высоким уровнем интеллекта, с определенными человеческими качествами: неравнодушные, интересующиеся, отзывчивые. В Университете ИТМО большое количество идейных людей в одном месте. Хочу процитировать слова моего научного руководителя Наталии Федоровны Гусаровой: «Эти люди концентрируются именно здесь. А здесь случайных людей не бывает, т.к. те, кто работают не за идею, а за что-то другое, - они вылетают мгновенно, т.к. они, с точки зрения науки и какого-либо креатива, ничего из себя не представляют вообще».
Наталия Федоровна: Если позволите, даже добавлю, что сами по себе здесь селектируются те люди, которые на первый уровень ставят идею. И они стремятся придумать и сделать что-то новое, и им это всегда интересно, им от этого «в кайф», а потом уже - все остальное. А радует меня очень многое: этот город, который я искренне и нежно люблю. Его архитектура меня очень сильно вдохновляет. Когда идешь по городу, смотришь по сторонам и понимаешь, насколько это великолепно, и осознаешь, что что-то раньше не видела, а сейчас – видишь. Это не мелкие радости, а то, что означает гармонию мира. И это действительно так и есть.

Что или кто повлиял на Вас во время принятия решения стать ученым?
Александра Ватьян: У меня сложилось все как-то постепенно. Изначально я не собиралась ни в аспирантуру, ни быть ученым. Я даже не задумывалась об этом. Почему-то я не рассматривала себя с этой точки зрения. Раньше я работала в частной компании, и мы занимались сайтами. Вполне неплохая была работа даже с точки зрения прибыли и творческих проявлений. А повлияла на меня встреча с моим научным руководителем Гусаровой Наталией Федоровной.
Наталья Добренко: Если позволите, добавлю, встреча с Наталией Федоровной сильно повлияла на нас с Александрой вместе, когда мы обучались в магистратуре.
Александра Ватьян: Да, именно так. Я пришла в магистратуру Университета ИТМО совершенно случайно из политеха и не знала куда идти, к кому из преподавателей обращаться, с кем можно поговорить. Я не знала никого: ни студентов, ни преподавателей. Так сложилось, что сразу необходимо было выбрать научного руководителя: ты приходишь, ты никого не знаешь, но выбрать нужно «здесь и сейчас». И вот, кто-то со старших курсов посоветовал Наталию Федоровну, и я обратилась к ней.
Наталья Добренко: Долгое время я старалась понять, в какой области я могу быть полезна, востребована, стать профессионалом и приносить пользу. Однажды судьба свела меня с Наталией Федоровной. После начала общения с этим человеком я поняла, что изучаемая мной область знания - это именно то, что близко, то, в чем я хочу развиваться, находить новые потенциалы. Тогда я приняла решение прийти в аспирантуру на кафедру под ее руководство, чтобы впоследствии стать молодым ученым.

Скажите, кто из исторических личностей Вам близок в искусстве побеждать?
Анатолий Абрамович: О! У меня просто – это Барклай-Де-Толли. Он вдохновляет!
Александра Ватьян: Даже и не знаю, кто именно.
Наталья Добренко: Я приведу пример человека, которого наблюдаю ежедневно, кто своими поступками и делами доказывает приверженность выбранному пути – это Наталия Федоровна. В то время как у нас, молодых ученых, на достижение того или иного результата уходит достаточно много сил и энергии, то у нее это получается на раз, как по щелчку пальцев. Вот такому искусству побеждать научные вопросы еще нужно учиться и учиться.

Текст и фото: Елизавета Кобец
Ведущий инженер
кафедры интеллектуальных технологий
в гуманитарной сфере Университет ИТМО

Справочная информация:
Шалыто Анатолий Абрамович, профессор, доктор технических наук, член Ученого совета, заведующий кафедрой Технологии программирования, главный научный сотрудник кафедры Технологии программирования, сотрудник подразделения Международной лаборатории «Компьютерные технологии», член диссертационного совета Д 212.227.06 Университет ИТМО.

Гусарова Наталия Федоровна, старший научный сотрудник, кандидат технических наук, заведующий отделом Редакционно-издательского отдела, доцент кафедры Интеллектуальных технологий в гуманитарной сфере Университет ИТМО.

Александра Ватьян, ассистент кафедры ИТГС, аспирант, факультета Инфокоммуникационных технологий, кафедры Интеллектуальных технологий в гуманитарной сфере Университет ИТМО.

Наталья Добренко, документовед Редакционно-издательского отдела, ассистент кафедры ИТГС, аспирант, факультета Инфокоммуникационных технологий, кафедры Интеллектуальных технологий в гуманитарной сфере Университет ИТМО. 

 

Информация © 2015-2018 Университет ИТМО
Разработка © 2015 Департамент информационных технологий