Конференция AI-MEN 2020: Чат-боты, интерфейс без дизайна и использование BERT-модели

Конференция, посвящённая ИИ, Machine Learning и Data Science прошла в Минске в третий раз. И впервые в онлайн-формате! Это позволило пригласить спикеров не только из Беларуси, но и Индии, России, Канады и Норвегии.

 

Вступительное слово

""

Открыл AI-MEN генеральный директор Belhard Игорь Мамоненко. Во вступительном слове «Искусственный интеллект: современные тренды» он отметил состояние рынка ИИ. По его словам, оборот рынка решений, связанных с ИИ, превышает 1 трлн долларов (в зависимости от страны).

Лидеры отрасли — это, конечно, США, также ЕС, Китай, Канада и Япония. В двадцатку входит также Индия и Россия. Среди компаний и организаций лидируют Google, Стэнфордский университет в Калифорнии, Массачуссеский технологический институт, университет Беркли и Институт Карнеги—Меллона. Университетская наука занимает достойное место в развитии отрасли. 

Искусственный интеллект есть практически в любой отрасли, где есть автоматизация, обработка данных, и с каждым годом его область применения увеличивается. Уже сейчас в работе с ИИ задействовано около 170 миллионов человек. К классическим областям применения, таким как обработка изображений, текстов, речи, семантический анализ и анализ данных добавляются новые тренды: увеличение автономности, когда робот или автомобиль пытается самостоятельно принимать решения, и объединение такого рода ИИ в одну сеть, то есть создание сетевого AI.  

В Беларуси ИИ развивается, есть уже более 150 стартапов, хотя они и не попадают пока в списки лидеров, но являются достаточно перспективными.

 

Семейство BERT: от академического концепт-кара к коммерческому применению

""

Андрей Хобня, Sr ML Engineer/Data Scientist, IHS Markit и Павел Гончаров, Data Scientist, IHS Markit поделились своим опытом в докладе «Семейство BERT: от академического концепт-кара к коммерческому применению». Они отметили, что BERT-подобные модели в компании IHS Markit используются для разработки инновационной AI-платформы управления знаниями. Задача — семантический поиск похожих фрагментов текста в документах. 

Задача поиска близких по смыслу (а не просто по ключевым словам) текстов лежит в основе множества различных приложений, таких как аудит документации, управление знаниями, «умный поиск» и комплаенс.

Но почему именно BERT-модели? Сейчас именно они позволяют получить state-of-the-art результаты в подавляющем большинстве задач обработки естественного языка. Например, BERT-подобная модель XLNet-Large достигает на академических бенчмарках по семантическому сходству текстов наилучших результатов: на датасете STS-B коэффициент корреляции Пирсона составляет 91,1. В начале 2018 года лучший результат был на уровне 78,6.

Как исследователи пришли к BERT? Прорыв в индустрии случился после того, как в задаче машинного перевода был придуман механизм «внимания». Данный механизм позволяет учесть с разным весом численные представления всех слов в исходной последовательности при генерации перевода. Прорыв заключался в том, что теперь можно было с высокой точностью переводить целые фразы, принимая во внимание контекст всего предложения.

Позднее исследователи решили применить механизм «внимания» внутри исходной последовательности, чтобы найти взаимозависимости между словами – такой способ получил название «self-attention», самовнимание. Именно механизм самовнимания лёг в основу всех моделей трансформеров, включая BERT. 

Авторы BERT-а придумали, как можно использовать архитектуру «трансформер», которая основана на механизме самовнимания, для того, чтобы построить огромную языковую модель, которая будет обучаться на задаче предсказания скрытых слов в последовательности и параллельно предсказывать, являются ли два последовательных предложения связанными по смыслу. BERT (Bidirectional Encoder Representations from Transformers) – языковая модель, которая была спроектирована специально для обучения на больших объёмах неразмеченного текста. После предобучения на большом корпусе текстов, BERT можно дотренировать под свою конкретную задачу, но уже хватит обучающей выборки относительно малого объема. Популярность BERT-а способствовала появлению множества производных от BERT моделей: ALBERT, XLNet, RoBERTa и т.д.

У BERT-моделей есть свои недостатки и ограничения, из-за которых такие модели сложно применять в реальных коммерческих системах. Одним из таких недостатков является алгоритмическая сложность self-attention – из-за необходимости соотносить каждый токен с каждым токеном в предложении. Второй недостаток: BERT – это огромная модель, в которой 110 миллионов параметров. Эти недостатки серьезно ограничивают скорость работы и масштабируемость BERT в случае обработки длинных текстов.

Авторы доклада строили реальную систему семантического поиска на основе BERT. На первых этапах развития системы применялись сиамские сети и векторный поиск. Данный подход хорошо масштабируется и позволяет обойти ограничения по скорости, однако основным недостатком данного метода является невысокое качество ранжирования результатов поиска.

Чтобы улучшить качество ранжирования, был адаптирован подход с использованием модели MonoBERT. Несмотря на то, что MonoBERT позволяет получить наилучшие метрики оценки качества, сама модель требует попарного сравнения запроса с каждым документом из поискового индекса без возможности предварительной векторизации, а также иногда даёт аномальные оценки семантического сходства для некоторых пар запрос-документ. Таким образом, модель имеет серьезные ограничения по скорости исполнения и плохо масштабируется на индексы с большим кол-вом текстов.

Поэтому на основе новейших исследований была использована и адаптирована для решаемой задачи архитектура модели, которая называется полиэнкодер. Авторы доклада предложили собственные улучшения, которые позволяют использовать данную архитектуру в задачах поиска для индексов с миллионами кандидатов, добившись практически константного времени выполнения вне зависимости от размера поискового индекса, сохранив при этом высокое качество ранжирования.

 

Третье поколение интерфейсов

""

О третьем поколении интерфейсов рассказал Денис Помозов, Head of Design at Memory.ai. Он отметил, что интерфейсами так или иначе пользуются даже те, у кого нет лэптопа или смартфона. Стараниями дизайнера сегодняшние интерфейсы стали достаточно понятными и простыми для пользователя. Но корневые, принципиальные проблемы остались всё те же. Интерфейсы не учитывают индивидуальности пользователя, контекст и обстоятельства, не распространяют опыт и данные одного приложения на все остальные и не меняют поведения, исходя из пользовательского опыта.

Программные системы, которые будут создаваться ИИ, потребуют принципиально нового подхода к созданию интерфейсов. Первое поколение имело слишком высокий уровень «входного билета»: необходимы были или специальные знания, или толстая книжка с набором команд. Благодаря Apple и Xerox появилось второе поколение интерфейсов, которое облегчило вход: достаточно было иметь определённый уровень абстрактного мышления и выучить базовый язык, на котором интерфейс работал. И до сих пор мы используем большое количество функций, которое заставляет нас думать алгоритмически, как наш мозг думать не любит и не приспособлен. Он хочет на каждую ситуацию получить свой конкретный шаблон. 

Если система нового поколения сможет «видеть и слышать» пользователя, предлагать ему персонализированную информацию, учитывать контент, непрерывно самообучаться, учитывать опыт других пользователей, то мы придём к тому, что необходимости в интерфейсе, который мы сейчас знаем. То есть, все известные нам способы взаимодействия с продуктом: окошки, меню, выборы, списки регистрации — всё это не будет иметь значения.

Уже создаваемый AI OS будет состоять из нескольких подсистем:

1.        Семантическая сеть, то есть база знаний, построенная вокруг пользователя,

2.        Обработчик знаний, принимающий решения, что важно на данный момент и что можно проигнорировать

3.        Интерфейс, который позволяет получать пользовательский фидбэк на решения системы.

И всё ещё остаются проблемы с приватностью (насколько пользователь готов так открыто делиться данными), хотя если система может распознать вас как физическое лицо, то это намного более безопасно, чем те системы защиты, которые есть сейчас.

 

Омниканальная платформа для создания и интеграции голосовых и чат-ботов

""

Тему чат-ботов затронули Леонид Букчин и Петр Бурак, ООО "БелХард Девелопмент» в своём выступлении «Омниканальная платформа для создания и интеграции голосовых и чат-ботов». Спикер подчеркнул: сегодня боты используются для помощи в работе: коммуникация, исследование качества, повышают скорость опросов и снижают расходы на них. По мере накопления графа знаний, бот становится всё более конструктивным: распознаёт речь, язык, эмоции и пол человека. 

Сейчас существуют онлайн-решения для ботов, которые даже не требуют глубоких познаний в программировании, а также в работу уже введёт проект «Twin» — омниканальная коммуникационная платформа для построения и интеграции голосовых и чат-ботов. Вся информация от клиента собирается со всех платформ — СМС, телефон, мессенджеры, онлайн-чат, электронная почта и социальные сети — в единый чат для оператора, который может ответить или перенаправить сообщение. Таким образом сохраняются все данные, которые предоставляет клиент, и нет необходимости уточнять их (например, с помощью звонка из колл-центра). Клиент может заходить с разных устройств или платформ на сайт компании и будет ожидать, что разговор с ним продолжат именно с того места, где и прервались. Это повышает лояльность клиента, которому не надо повторять одну и ту же информацию или уточнять что-то у оператора.

Бота можно рассматривать как полноценного сотрудника компании, которому помогают люди, а не наоборот. Например: человек сделал заказ в онлайн-чате в социальной сети, перешёл оттуда на сайт компании и звонит. Бот тут же поднимет трубку, поприветствует клиента согласно ранее введённым данным, сообщит статус заказа — ведь обычно звонить будут в случае, если хотят сделать дозаказ или узнать его состояние. И только если бот испытывает какие-то затруднение, тогда он может переключить клиента на другого бота, на живого сотрудника или даже курьера, который уже в пути.

В настоящее время перспективной кажется система, в которой будет несколько специализированных ботов и один бот-«дирижёр», управляющий.

В будущем видятся такие тенденции:

1.        Диалоговых ботом станет больше и среднестатистический клиент от этого выиграет

2.        Чат-боты и голосовые боту станут умнее и научатся лучше понимать собеседника

3.        Крупные корпорации будут создавать собственных голосовых ассистентов, которые станут представителями бренда

4.        Компании, не готовые создавать собственных AI представителей, будут использовать голосовых помощников типа Алисы

5.        Звонки от ботов станет проще блокировать, ввиду появления более умной системы или даже изменений в законодательстве

6.        При всём этом робот всё равно, конечно, в ближайшее время не заменит человека.

 

Перспективы развития Artificial Intelligence, Data Science и Machine Learning в Республике Беларусь. Куда двигаться

""

Дмитрий Балаш, заместитель генерального директора Belhard, руководитель Лаборатории конечных автоматов и грамматик (Belhard), провёл экскурс в историю и рассмотрел перспективы развития Artificial Intelligence, Data Science и Machine Learning в Республике Беларусь.

ИИ — это не новинка последних 20 лет, а началось всё с развития компьютерных наук, основанных на математике. Это производный продукт развития вычислительных машин. Первый пик интереса к ИИ был ещё в 60 годы прошлого века, второй пришёлся на 80-ые и третий — это уже современность. 

Для того, чтобы заняться работой с искусственным интеллектом, необходимо умение составлять математическую модель объектов реального мира — то есть хорошая физико-математическая база. Среди всех направлений математики наиболее востребованным будет комбинирование матмоделей как систем уравнений, знание конечных автоматов (то есть технологий), матричные и тензорные исчисления. Кроме того, понадобится и разработка универсальных и специализированных вычислителей, приборов для захвата и хранения данных о реальном мире.  

В Беларуси подобные технологии изначально разрабатывались в научных центрах — университетах и институтах. После с развитием компьютерной техники появились доступные алгоритмы и движки, а также крупные компании выложили в open source некоторые свои решения. Но в общем основные формы развития AI, ML и DS в Беларуси — это изучение, кастомизация и имплементация готовых решений. И если раньше мы работали большей частью на аутсорс, то сейчас, когда в Индии стал час программиста стоить намного дешевле и бизнес перешёл туда, появился тренд на продукты с высокой научной составляющей. А для этого необходимо развивать эту научную составляющую.

Раньше бизнес не вкладывался в образование, но теперь пришло понимание, что этим важно заниматься. Компаниям важно не экономить, а специалистам IT-сферы необходимо обратить внимание на продукты с высокой научной составляющей, заняться самообразованием в сфере математики и физики.

 

Золотой партнёр конференции: IHS Markit

Партнер конференции BelHard

Организатором выступил старейший ИТ-портал Беларуси KV.by.

Запись трансляции конференции можете посмотреть по ссылке. Презентации спикеров можете скачать тут. Если вы выступили в качестве слушателя конференции, просим пройти небольшой опрос.

 

Как вам новость?