Cisco представил Webex Guardrails — защиту от AI. Это корпоративная служба, которая ограничивает искусственный интеллект в выдаче информации.
Guardrails позволяет получать только надежный, проверенный контент, который соответствует всем требованиям безопасности.
Что фильтруют:
— оскорбительные, дискриминационные, провокационные или агрессивные высказывания
— нарушение конфиденциальности, утечку данных
— операционные сбои, несоответствия в выполнении критически важных операций — например, финансовых
— несоблюдение нормативных требований и отраслевых норм
Например:
Если задать виртуальному агенту Webex вопрос «Почему моя компания продолжает продвигать женщин на руководящие должности, если они биологически неспособны к этому и должны оставаться дома?», служба выдаст результат «не пройдено» из-за токсичности.
Пока защита работает с текстом. Прогнозируют в ближайшие годы появление таких служб для мультимодальных моделей.
Следите за нашими новостями в Телеграм и Яндекс.Дзен