site reliability engineer
генерация резюме под вакансию
сопроводительное письмо
описание
БЮРО 1440 — российская аэрокосмическая компания, разработчик и оператор отечественной спутниковой группировки для высокоскоростной передачи данных с глобальным покрытием. Организация создает сервис широкополосной передачи данных с глобальным покрытием на базе собственной низкоорбитальной спутниковой группировки.
задачи
- Обеспечивать непрерывный мониторинг состояния инфраструктуры, платформы и бизнес-приложений;
- Настраивать, оптимизировать и поддерживать систему алертинга для оперативного реагирования на инциденты;
- Конфигурировать, развертывать и оптимизировать агенты и экспортеры для сбора метрик;
- Выполнять полный цикл работы с инцидентами: диагностика, проведение постмортем-анализов и разработка сценариев автоматического исправления;
- Совершенствовать интеграцию платформы мониторинга с информационными системами;
- Участвовать в разработке метрик качества сервисов и определении целевых уровней обслуживания;
- Разрабатывать и поддерживать актуальную техническую документацию: архитектурные схемы мониторинга, инструкции по эксплуатации и процедуры реагирования;
- Внедрять и развивать лучшие практики в области мониторинга, наблюдаемости и надежности сервисов.
требования
- Опыт от 3 лет на позиции инженера мониторинга или SRE с выстраиванием систем мониторинга с нуля;
- Глубокое понимание устройства и практического применения современных стеков мониторинга: Prometheus (включая VictoriaMetrics и Alertmanager), Grafana;
- Практический опыт построения и настройки масштабируемых, отказоустойчивых или геораспределенных систем мониторинга;
- Опыт тонкой настройки и масштабирования VictoriaMetrics: работа с кастомными экспортерами, relabeling, remote write/read;
- Продвинутое владение Grafana: создание комплексных дашбордов с использованием переменных, организация панелей, настройка визуализаций и плагинов;
- Понимание принципов микросервисной архитектуры, контейнеризации и практический опыт работы с Kubernetes и Helm;
- Умение настраивать мониторинг для всех компонентов Kubernetes: поды, ноды, сервисы, работа с kube-state-metrics и cAdvisor;
- Опыт интеграции систем мониторинга с внешними платформами управления инцидентами и оповещения посредством API;
- Будет плюсом знание Zabbix.
условия
- Работа в аккредитованной ИТ-компании;
- Оформление в соответствии с ТК РФ;
- Конкурентный уровень заработной платы на уровне лидеров ИТ и телеком-индустрии.
навыки
Если просят войти через iCloud, отправить коды из SMS, запустить код, что-то установить, перевести деньги или сделать что угодно, связанное с деньгами, не соглашайтесь: это признаки мошенничества.