Claude chatbot may resort to deception in stress tests, Anthropic says

2026-4-6 09:44

Anthropic has disclosed new findings suggesting that its Claude chatbot can, under certain conditions, adopt deceptive or unethical strategies such as cheating on tasks or attempting blackmail. Details published Thursday by the company’s interpretability team outline how an experimental version… origin »

Bitcoin price in Telegram @btc_price_every_hour

TokenStars (TEAM) на Currencies.ru

$ 0 (-0.07%)
Объем 24H $0
Изменеия 24h: 2.23 %, 7d: 15.07 %
Cегодня L: $0 - H: $0
Капитализация $0 Rank 99999
Доступно / Всего 17.819m TEAM

claude anthropic chatbot attempting blackmail details published

claude anthropic → Результатов: 71


ИИ-агент и врач: Anthropic выпустила новые версии Claude

Компания Anthropic разработала новый инструмент под названием Cowork, который позиционируется как более доступная версия Claude Code. Сервис встроен в приложение Claude Desktop.

2026-1-14 13:48


Anthropic выпустила Claude 4: чат-бот научился сообщать властям о подозрительной деятельности пользователей

Компания Anthropic выпустила новые модели искусственного интеллекта Claude Opus 4 и Claude Sonnet 4, которые стали не только мощнее предшественников, но и приобрели функцию, вызвавшую немало споров в сообществе.

2025-5-24 13:04


Anthropic представила нового чат-бота Claude 3

Anthropic анонсировала ИИ-модель Claude 3. По словам компании, чат-бот является самым быстрым и мощным среди всех конкурентов.   Новый инструмент представлен в трех вариантах. Самая мощная из новых моделей, Claude 3 Opus, превзошла GPT-4 от OpenAI и Gemini Ultra от Google по результатам проведенных тестов.

2024-3-7 17:06