Автонаведение, распознавание лиц, виртуальный фон и другие функции призваны улучшить впечатление от проведения видеоконференций.
Недавно я посетил конференции Cisco Collaboration Summit и Microsoft Build, где мне удалось по-настоящему заглянуть в “будущее” видеоконференций. Сегодня каждый ВКС-вендор в корпоративном секторе стремится выпустить решения с революционными функциями, чтобы сделать видеоконференции еще комфортнее и эффективнее.
И все потому, что технологии на базе искусственного интеллекта (ИИ) уже стучатся в двери конференц-залов. С помощью ИИ можно улучшить качество систем конференцсвязи и облегчить их использование. Общий принцип состоит в том, чтобы сделать технологию невидимой для пользователя: улучшить функционал без добавления лишних кнопок.
Видеоконференции — это фундамент совместной работы. Они объединяют людей и команды, серверные решения и облачные сервисы, электронную почту и мгновенные сообщения, мобильные устройства, ПК и комнатные системы, контент, календари и задачи.
20 лет назад, когда мой сын еще пешком под стол ходил, всё оборудование для ВКС сводилось к проектору и аналоговому телефону. В те годы в индустрии было несколько крупных прорывов (например, конференц-телефон Polycom SoundStation), но в целом инновации были инкрементальными. Например, переход от аналоговых IP-терминалов к цифровым практически никто не заметил.
За последнее десятилетие технологии стали наращивать темп и сильно продвинулись вперед. Широкополосный звук, видео качества HD и демонстрация рабочего стола уже никого не удивляют. А совсем недавно появились электронные доски, которые позволили сделать рабочие процессы более интерактивными.
Развитие технологий также повлекло за собой дополнительные затраты и трудности. Однако есть и хорошая новость: вскоре все изменится. На конференции Microsoft Build показали множество революционных технологий, например, как можно автоматически распознавать участников конференции, получить текстовую расшифровку и перевод конференции в реальном времени, а также организовывать встречи и бронировать свободные переговорные комнаты с помощью голосовых команд. Спасибо Microsoft! И это ведь была конференция для разработчиков, которые ненавидят видеосвязь.
Вы даже не представляете, сколько идей для развития конференцсвязи я услышал в марте на Enterprise Connect — конференции для ключевых игроков рынка корпоративных коммуникационных услуг. Давайте рассмотрим несколько основных инноваций.
Автонаведение
Концепция не нова. Polycom представила EagleEye еще в 2011 году, а Cisco выпустил видеокамеру SpeakerTrack в 2013. Оба решения заменяют оператора виртуальной камеры, поворачивая, наклоняя, масштабируя изображение и переключаясь между камерами. Технологии следующего поколения позволили заменить механические приводы и отслеживание звука на автонаведение на базе ИИ.
Решения с функцией автонаведения становятся все более доступными. На Enterprise Connect корпорация Microsoft продемонстрировала инновации в области автонаведения на примере Skype Room Systems. А конференц-система Logitech Meetup стоимостью около $1,000 вскоре выпустит бесплатное обновление с функцией автонаведения. Дата выхода обновления официально не объявлена, но я уверен, что мы вскоре услышим о нем на конференции InfoComm в июне.
Dolby также внедрила технологию автонаведения в свою первую систему для видеоконференций Dolby Voice Room. Первоначально система будет совместима с сервисами BlueJeans и Highfive. Камера с автонаведением на базе ИИ реагирует на жесты и выравнивает изображение электронной доски, установленной в нестандартном положении.
Нет никаких сомнений в том, что видеоконференции становятся стандартным способом проведения встреч и собраний. Все больше сотрудников работают удаленно, а офлайновые конференц-залы в основном используют в качестве телефонной будки для личных звонков с мобильного телефона.
Распознавание лиц и не только
У Cisco появился целый ряд инноваций, связанных с ИИ. Компания представила технологии автонаведения, распознавания лиц, а также получение метаданных, включая количество участников определенного собрания. Microsoft, Logitech и NEC создают похожие решения, различаются лишь подходы. Например, Cisco использует мобильные телефоны в качестве дополнительного идентификатора участников.
К функции текстовой расшифровки речи на базе ИИ добавляется функция распознавания лиц, чтобы не только получить текст, но и узнать, кто его автор. В Microsoft Teams уже доступен интегрированный перевод, демонстрация экрана, трансляции и поиск.
Виртуальные голосовые помощники
Некоторые вендоры, включая Microsoft, Vonage и Cisco, уже представили или только анонсировали виртуальных голосовых помощников для ВКС. Благодаря виртуальным помощникам, пользователи могут запланировать, создать или присоединиться к конференции с помощью голосовых команд.
Замена фона
Zoom и Microsoft используют ИИ для управления виртуальным фоном. Zoom предлагает встроенную функцию «зеленого экрана» для полной замены фона, а Microsoft запустила функцию размытия фона в целях конфиденциальности (например, размытие конфиденциальной информации на электронной доске за спиной у участников конференции).
Сегодня практически любое устройство и приложение поддерживает видео. Согласно отчету Logitech, продажи систем для видеосвязи и совместной работы Logitech составили $200 млн, что примерно на $200 млн больше, чем пять лет назад. ВКС-оборудование активно используется с программным обеспечением от Microsoft, Google, Cisco, Zoom и т.д.
Видеосвязь сегодня стала важнее, чем когда-либо прежде, а технологии искусственного интеллекта позволяют вывести ВКС на новый уровень. Раньше многим казалось, что видеоконференции и продуктивность — понятия несовместимые. Однако все чаще компании набирают удаленных сотрудников, а работу выполняют именно в онлайн-режиме благодаря различным инструментам совместной работы, включая демонстрацию контента и электронные доски.