|
| 1 | +--- |
| 2 | +title: Хаос-инженерия |
| 3 | +status: Completed |
| 4 | +category: concept |
| 5 | +tags: ["methodology", "", ""] |
| 6 | +--- |
| 7 | + |
| 8 | +Хаос-инженерия (_chaos engineering_, CE) — подход, при котором над [распределенной](/distributed-systems/) production-системой проводятся различные эксперименты, |
| 9 | +цель которых — убедиться, что она способна противостоять турбулентным и неожиданным ситуациям. |
| 10 | + |
| 11 | +## Какую проблему решает |
| 12 | + |
| 13 | +Практики [SRE](/site-reliability-engineering/) и [DevOps](/ru/devops/) концентрируются на |
| 14 | +методах повышения отказоустойчивости и надежности систем. |
| 15 | +Способность системы выдерживать сбои, обеспечивая при этом надлежащее качество обслуживания, |
| 16 | +как правило, является одним из требований при разработке программного обеспечения. |
| 17 | +Перебои в работе (основанного на [микросервисах](/microservices/)) приложения могут быть связаны с различными аспектами: |
| 18 | +инфраструктурой, платформой и другими компонентами, которые могут изменяться. |
| 19 | +Частое развертывание новых функций в production-окружении повышает вероятность критического инцидента |
| 20 | +и простоя со значительными негативными последствиями для бизнеса. |
| 21 | + |
| 22 | +## Как именно решает проблему |
| 23 | + |
| 24 | +Хаос-инженерия помогает удовлетворить требования к живучести систем. |
| 25 | +Она используется для проверки устойчивости инфраструктуры, платформ и приложений к сбоям. |
| 26 | +В рамках хаос-экспериментов в систему вводятся случайные «поломки», чтобы проверить, способны ли приложение, |
| 27 | +инфраструктура или платформа самовосстанавливаться, и убедиться, что сбой не оказывает значимое негативное влияние на потребителей. |
| 28 | +Хаос-эксперименты направлены на выявление «слепых зон» (например, в мониторинге или при автомасштабировании) |
| 29 | +и на улучшение коммуникаций между командами во время критических инцидентов. |
| 30 | +Такой подход позволяет повысить отказоустойчивость сложных систем (в том числе production-уровня) и уверенность команд в них. |
0 commit comments