Безопасность

Безопасный ИИ — с самого начала.

Безопасность — не слой, добавленный в конце. Это часть обучения, развёртывания и реагирования на инциденты.

Принципы

Четыре правила, что направляют каждое решение.

01

Полезный

Системы должны помогать как можно большему числу людей, на их языке и с их контекстом.

02

Честный

Мы говорим, что знаем и чего не знаем. Цитируем источники. Признаём ошибки.

03

Безвредный

Мы не помогаем причинить вред. Оцениваем перед развёртыванием и наблюдаем после.

04

Проверяемый

Мы публикуем оценки, методы и результаты — включая отрицательные.

Система безопасности

Как мы строим каждый релиз.

Четыре этапа, которые мы повторяем для каждой модели, функции и развёртывания.

01

Дизайн с безопасностью

Команда безопасности участвует с первой строки кода каждой модели. Не ревьюер — соавтор.

02

Открытая оценка

Перед каждым запуском прогоняем 612 тестов в 11 категориях. Результаты идут в публичный отчёт.

03

Постепенный вывод

Начинаем с закрытой группы, затем масштабируем по странам и тарифам, наблюдая за инцидентами в реальном времени.

04

Реакция на инциденты

Если что-то ломается — обнаруживаем за 15 минут и публикуем разбор за 7 дней.

Безопасность — это публичное обязательство, иначе её нет. Если только мы знаем, что измеряем, только мы можем сказать, что прошли.
VC
VCorp
Безопасность
Материалы

Открытая документация.

Репозиторий на GitHub

Карточки моделей

Техническая карточка каждой модели с её оценками по полной системе.

Правила использования

Что можно и чего нельзя делать с vMira — и почему.

Центр прозрачности

Операционные решения, отчёты об инцидентах и разборы.

Работай безопасно.