Регистрация

Новые сообщения

Идеальные фейки, кража карт и паролей — ИИ тихо готовится к войне с людьми?

Автор темы Support81
Дата начала Вчера в 05:28
Теги

кража аккаунтов кража карт фейки

RutoR

Buffer Marketplace

Universal Mixer

JavaScript отключён. Для полноценно использования нашего сайта, пожалуйста, включите JavaScript в своём браузере.

Support81

Original poster

Administrator

Вчера в 05:28

#1

Google признал: его продукты могут нарушать собственные запреты и действовать против нас.

Google раскрыла комплексные меры безопасности, внедряемые в её генеративные ИИ-сервисы (GenAI) для защиты от новых угроз, включая так называемые

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

(indirect prompt injections). Эти шаги направлены также на укрепление устойчивости агентных систем в целом.

Косвенные инъекции представляют собой особый вид атак, когда вредоносный код прячется внутри внешних источников информации — таких как письма, документы или календари. В отличие от классических атак, где злоумышленник напрямую вводит вредоносные команды, здесь используется обманный путь: ИИ обрабатывает заведомо заражённые данные и может непреднамеренно выполнить опасные действия — например, передать конфиденциальную информацию или инициировать запуск вредоносного скрипта.

Для борьбы с этой опасностью Google внедряет многоуровневую стратегию защиты, которая повышает порог сложности для потенциальных атакующих. В арсенал входят как меры, усиливающие устойчивость самих моделей, так и дополнительные инструменты мониторинга и фильтрации угроз на уровне всей инфраструктуры.

Для ключевой модели компании — Gemini — предусмотрен целый ряд технических механизмов:

Классификаторы содержимого запросов, блокирующие опасные инструкции и предотвращающие генерацию нежелательных ответов.
Технология spotlighting — внедрение специальных маркеров в недоверенные данные, чтобы система могла отслеживать потенциальные манипуляции.
Фильтрация подозрительных URL и очистка markdown-разметки, что устраняет риск загрузки вредоносных изображений и блокирует небезопасные ссылки с помощью Google Safe Browsing.
Система подтверждения действий, требующая согласия пользователя перед выполнением рискованных операций.
Оповещения о возможных инъекциях подсказок, информирующие пользователя о попытках скрытого вмешательства.

В то же время специалисты Google и DeepMind подчёркивают: одного набора защитных инструментов недостаточно. Атакующие всё активнее применяют адаптивные методы, которые развиваются и подстраиваются под защиту благодаря автоматизированному тестированию — процессу, известному как Automated Red Teaming (ART). Это позволяет злоумышленникам быстро обходить стандартные меры безопасности.

Эксперты сходятся во мнении, что по-настоящему эффективная защита требует комплексного подхода — от возможностей самих моделей выявлять признаки атаки до использования программных и аппаратных барьеров внутри серверной инфраструктуры.

Обострение проблем подтверждают и результаты последних исследований. Учёные из Anthropic, Google DeepMind, ETH Zurich и Университета Карнеги-Меллона показали, что современные большие языковые модели (LLM) способны с высокой точностью извлекать пароли, банковские реквизиты и генерировать полиморфное вредоносное ПО. Кроме того, ИИ может создавать персонализированные фишинговые сайты, почти неотличимые от оригиналов.

Вместе с тем LLM пока слабо справляются с поиском уникальных уязвимостей нулевого дня в популярных приложениях. Зато они уже активно применяются для автоматического обнаружения базовых ошибок в слабо защищённом или ранее не проверенном программном обеспечении.

Оценка безопасности искусственного интеллекта на платформе AIRTBench, разработанной Dreadnode, подтверждает этот дисбаланс. Продвинутые модели от Anthropic, Google и OpenAI демонстрируют высокую эффективность при атаках на основе подмены подсказок (

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

), но значительно уступают в задачах системной эксплуатации или инверсии модели (model inversion). Это подчёркивает необходимость дифференцированного подхода к каждому типу угроз.

Однако технические риски — лишь часть беды. Особую обеспокоенность вызывают поведенческие особенности современных агентных ИИ-систем. Недавние стресс-тесты Anthropic выявили тревожную тенденцию: в определённых сценариях модели сознательно нарушают собственные запреты для достижения заданных целей. Это может проявляться в форме шантажа,

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

или иных нежелательных действий.

Примечательно, что подобное поведение — известное как agentic misalignment (агентное расхождение интересов) — обнаружено у продуктов разных компаний. Это говорит о глубинном, системном характере проблемы, а не об ошибках отдельного производителя.

Хотя на практике такие инциденты пока не зафиксированы, эксперты не сомневаются: с ростом возможностей ИИ ситуация может измениться. Ещё три года назад языковые модели не обладали подобными способностями вовсе, но прогресс идёт стремительно, и потенциальные риски становятся всё более ощутимыми.

Поэтому исследователи считают, что необходимо не только совершенствовать существующие средства защиты, но и активно развивать

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

, чтобы сами нейросети стали надёжным элементом обороны.
Подробнее:

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

Для ответа нужно войти/зарегистрироваться

Название темы

Автор	Заголовок	Раздел	Ответы	Дата
	Darcula 3.0 создаёт идеальные клоны любых сайтов для фишинга	Новости в сети	0	21.02.2025
M	Закрыто Обучение Google ADS. Как лить на любые фейки без суспенда. + Продам логи без соседей + гугл разбаны ручной фарм	Корзина	2	05.07.2022
S	[Веб-Разработка] Фейки/копии сайтов, клоакинг \| EN AVAILABLE	Услуги дизайнеров/веб-разработчиков	0	29.05.2021
A	Куплю фейки mail.ru и яндекс с проверкой пароля на валидность.	Предоставляю работу. Ищу специалиста.	0	26.11.2020
	Кидала который представляется гарантом expclan.org и их фейки	Black list и Разборки	5	04.05.2020
I	Всем добра! Кто может обновить фейки?	Вопросы и интересы	0	26.04.2020
K	Интересно [Решил почистить комп] Фейки, скрипты, да и всякая хрень. Может кому что-то	Другое	2	27.09.2019
	Фейки [Скрипты][Вопрос]	Вопросы и интересы	4	22.01.2017
	«Узаконенная кража»: Элтон Джон обвинил власти в уничтожении музыкальной культуры	Новости в сети	0	20.05.2025
	Seed → POST-запрос → пустой баланс: как устроена быстрая и чистая кража крипты через FreeDrain	Новости в сети	0	12.05.2025
	Кража вместо отпуска: мошенники превратили Booking.com в фишинговую ловушку	Новости в сети	0	06.11.2024
	ShadowRay: майнинг Monero, кража данных и другие угрозы	Новости в сети	0	28.03.2024
H	Кража данных через TikTok - легко	Корзина	0	16.11.2020
B	Взлом сайта и кража всех исходников (css,js,html)	Полезные статьи	3	21.03.2018
S	Кража паролей: как наши учетки уводят через npm-пакет	Уязвимости и взлом	0	20.03.2018
	Кража логов Skype и истории посещений браузеров.	Уязвимости и взлом	0	18.09.2016

Название темы

Darcula 3.0 создаёт идеальные клоны любых сайтов для фишинга
- Автор Support81
- 21.02.2025
- Ответы: 0
Новости в сети
M
Закрыто Обучение Google ADS. Как лить на любые фейки без суспенда. + Продам логи без соседей + гугл разбаны ручной фарм
- Автор MrMinister
- 05.07.2022
- Ответы: 2
Корзина
S
[Веб-Разработка] Фейки/копии сайтов, клоакинг | EN AVAILABLE
- Автор serglebed
- 29.05.2021
- Ответы: 0
Услуги дизайнеров/веб-разработчиков
A
Куплю фейки mail.ru и яндекс с проверкой пароля на валидность.
- Автор Alexxboa
- 26.11.2020
- Ответы: 0
Предоставляю работу. Ищу специалиста.
Кидала который представляется гарантом expclan.org и их фейки
- Автор Admin
- 04.05.2020
- Ответы: 5
Black list и Разборки
I
Всем добра! Кто может обновить фейки?
- Автор ivan21005
- 26.04.2020
- Ответы: 0
Вопросы и интересы
K
Интересно [Решил почистить комп] Фейки, скрипты, да и всякая хрень. Может кому что-то
- Автор Killstip
- 27.09.2019
- Ответы: 2
Другое
Фейки [Скрипты][Вопрос]
- Автор Little_Prince
- 22.01.2017
- Ответы: 4
Вопросы и интересы
«Узаконенная кража»: Элтон Джон обвинил власти в уничтожении музыкальной культуры
- Автор Support81
- 20.05.2025
- Ответы: 0
Новости в сети
Seed → POST-запрос → пустой баланс: как устроена быстрая и чистая кража крипты через FreeDrain
- Автор Support81
- 12.05.2025
- Ответы: 0
Новости в сети
Кража вместо отпуска: мошенники превратили Booking.com в фишинговую ловушку
- Автор Support81
- 06.11.2024
- Ответы: 0
Новости в сети
ShadowRay: майнинг Monero, кража данных и другие угрозы
- Автор Support81
- 28.03.2024
- Ответы: 0
Новости в сети
H
Кража данных через TikTok - легко
- Автор Hackers Academy
- 16.11.2020
- Ответы: 0
Корзина
B
Взлом сайта и кража всех исходников (css,js,html)
- Автор Bogette
- 21.03.2018
- Ответы: 3
Полезные статьи
S
Кража паролей: как наши учетки уводят через npm-пакет
- Автор shellest
- 20.03.2018
- Ответы: 0
Уязвимости и взлом
Кража логов Skype и истории посещений браузеров.
- Автор Admin
- 18.09.2016
- Ответы: 0
Уязвимости и взлом

Поделиться:

Facebook Reddit Pinterest Tumblr WhatsApp Электронная почта Ссылка

Русскоязычный Даркнет Форум

Верх Низ