B2B · серверы и СХД · Москва и МО

Ремонт серверов и СХД в Москве и МО

Board-level ремонт серверов Dell PowerEdge, HP ProLiant, Supermicro и СХД: блоки питания, RAID-контроллеры, восстановление массивов, бэкплейны, память ECC и контроллеры iDRAC / iLO / IPMI. Выезд инженера, SLA, КП и документы.

Board-level ремонтВыезд в ЦОД и офисSLA от 4 часовКП, договор, ЭДО
Стендовая диагностика серверной платы и RAID-контроллера в лаборатории РемФикс
Нагрузочный тест 4–8 ч

Вывод инженера

отказал узел питания, сервер ремонтопригоденКП, сроки и гарантия фиксируются до старта.
0 ₽первичная оценка по логам
от 4 чSLA на реакцию по парку
до 12 месгарантия в документах
ЭДОсчет, договор, акт
Процесс ремонта серверов: логи iDRAC, стендовая диагностика, КП, board-level ремонт и стресс-тест

Не IT-аутсорс, а сервис плат

Ремонтируем сервер на уровне платы, а не меняем целиком

Большинство IT-подрядчиков при отказе сервера предлагают заменить узел или весь корпус. Мы работаем глубже: читаем логи iDRAC / iLO / IPMI, находим конкретный отказавший элемент и восстанавливаем его board-level — там, где это выгоднее и быстрее замены.

  • диагностируем по логам и стенду, а не меняем блок наугад;
  • согласуем КП, сроки и порядок работы с данными до старта;
  • после ремонта даем акт, гарантию и стресс-тест узла.

Когда это выгодно

Если простой сервера дороже ремонта, причину нужно найти быстро

В сервере отказывает не вся машина, а конкретный узел: дежурка блока питания, силовой ключ, цепь VRM, кэш RAID-контроллера, слот памяти или линия на бэкплейне. Мы диагностируем по логам и на стенде и честно говорим, что выгоднее: board-level ремонт, замена узла или подбор аналога.

PSU

Блоки питания серверов

Замена силовых ключей, ШИМ-контроллеров, конденсаторов и дежурки в БП Delta, Lite-On, Artesyn и оригинальных PSU. Восстанавливаем работу в режиме резервирования 1+1.

RAID

RAID-контроллеры и кэш

PERC, Smart Array, MegaRAID, ServeRAID: ремонт платы, замена кэш-памяти, BBU/суперконденсаторов и батареек, восстановление BIOS и прошивки контроллера.

Storage

Восстановление RAID и СХД

Развалившиеся массивы RAID 0/1/5/6/10, выпавшие диски, деградация и rebuild. Снимаем образы дисков, собираем массив на стенде и достаем данные.

Mainboard

Материнские платы и бэкплейны

Серверные платы Dell, HP, Supermicro и SAS/SATA/NVMe-бэкплейны: ремонт цепей питания VRM, разъемов, сбойных слотов памяти и дисковых каналов.

ECC

Память ECC и слоты

Диагностика ошибок ECC, поиск сбойного модуля или слота DIMM, чистка контактов, ремонт линий памяти и VRM, подбор совместимых RDIMM/LRDIMM.

BMC

IPMI, iDRAC и iLO

Контроллеры удаленного управления: нет доступа к iDRAC/iLO/IPMI, не поднимается веб-интерфейс, ошибки BMC, потеря лицензии и сетевого порта управления.

Cooling

Охлаждение и термопаста

Чистка от пыли, замена термопасты и термопрокладок на CPU и чипсете, ремонт и замена серверных вентиляторов и PWM-цепей при перегреве и троттлинге.

Backplane

Бэкплейны и экспандеры

SAS-экспандеры и дисковые корзины: пропадают диски, ошибки на бэкплейне, битые линии, поврежденные разъемы питания и данных в дисковых отсеках.

Симптомы

С какими неисправностями серверов стоит обращаться

Формулировки ниже совпадают с тем, как сбой обычно описывают системные администраторы и инженеры в логах iDRAC, iLO и IPMI.

сервер не стартует, не доходит до POST или уходит в защиту по питанию

пищит POST-кодами, моргает индикатором или зависает на инициализации

ошибки в iDRAC / iLO / IPMI: CPU, VRM, PSU, FAN, память или BMC

деградация RAID, выпал диск, массив не собирается или идет бесконечный rebuild

ECC-ошибки памяти, сбойный модуль DIMM или нерабочий слот

перегрев и троттлинг, разгон вентиляторов на максимум, аварийное выключение

блок питания в защите, не запускается резервирование 1+1 или мигает оранжевым

пропадают диски в корзине, ошибки на SAS-бэкплейне или экспандере

Процесс

Логи, стенд, КП и ремонт без сюрпризов для бухгалтерии

Серверный ремонт нельзя вести как бытовую заявку. Нужны логи iDRAC / iLO / IPMI, стендовая проверка под нагрузкой, согласование стоимости до старта и документы после выдачи оборудования.

Получить КП
01

Логи и вводные

Снимаем System Event Log из iDRAC / iLO / IPMI, POST-коды и описание сбоя. По логам уже видно, что отказало: PSU, VRM, память, RAID или бэкплейн.

02

Первичная оценка

Инженер по логам и фото говорит, есть ли смысл в стендовой диагностике, какие риски для данных и можно ли решить вопрос выездом на площадку.

03

Стендовая диагностика

Проверяем питание, силовую часть, RAID-контроллер, бэкплейн и память. Под нагрузкой 4–8 часов ловим плавающие отказы, перегрев и сбои ECC.

04

КП и согласование

Фиксируем дефектовку, список работ, сроки, стоимость, гарантию и документы до ремонта. Для данных согласуем порядок снятия образов дисков.

05

Ремонт и восстановление

Board-level пайка, замена силовых ключей, конденсаторов и кэша, сборка RAID, ремонт бэкплейна и цепей питания памяти.

06

Стресс-тест и акт

Прогоняем стресс-тест памяти, дисков и питания, проверяем целостность массива, передаем акт, рекомендации и гарантийные условия.

Сценарии

Когда board-level ремонт сильнее покупки нового сервера

Мы не обещаем “починить все”. Мы беремся за задачи, где диагностика дает экономический смысл, спасает данные и снижает простой инфраструктуры.

Сервер не стартует после грозы

Скачок по питанию выбил дежурку БП, VRM или цепи на материнской плате. Снимаем логи, находим выгоревший узел и восстанавливаем питание board-level — без замены всего сервера.

Развалился RAID, нужны данные

Выпало несколько дисков, массив не собирается, идет нескончаемый rebuild. Сначала снимаем образы дисков, потом собираем RAID на стенде и достаем данные — порядок работ согласуем до старта.

Парк серверов на SLA

Стойка серверов в ЦОД или офисе, простой считается в деньгах. Берем парк на абонентское обслуживание, держим SLA от 4 часов, выезжаем на площадку и работаем по договору и ЭДО.

Стоимость

Ориентиры до диагностики

Финальную цену называем после проверки на стенде. Если нужны редкие компоненты, кэш-память RAID, силовые ключи, прошивка контроллера или восстановление данных, это фиксируется в КП до начала ремонта. Абонентское обслуживание и срочный выезд считаем по задаче.

Первичная оценка по логам iDRAC/iLO0 ₽
Диагностика на стендеот 4 900 ₽
Ремонт серверного блока питанияот 5 900 ₽
Ремонт RAID-контроллераот 7 900 ₽
Замена / ремонт бэкплейнаот 8 900 ₽
Восстановление RAID-массиваот 9 900 ₽
Абонентское обслуживание / SLAпо задаче
Срочный выезд инженера по Москвепо задаче

Платформы и бренды

Ремонтируем серверы и СХД основных вендоров

Список не означает “официальный сервис” и не обещает ремонт любой конфигурации. Он показывает платформы, по которым есть смысл прислать логи iDRAC / iLO / IPMI, модель и симптом для первичной оценки.

Dell PowerEdgeHP ProLiantSupermicroLenovo ThinkSystemCisco UCSHuawei FusionServerFujitsu Primergy

FAQ

Вопросы перед передачей сервера в работу

Короткие ответы нужны до заявки: так понятно, какие логи и данные подготовить и чего ждать после диагностики.

Чем board-level ремонт отличается от замены узла?

При board-level ремонте мы находим конкретный неисправный элемент на плате — силовой ключ, ШИМ-контроллер, конденсатор, кэш RAID или цепь VRM — и меняем именно его. Это дешевле и быстрее, чем менять материнскую плату, RAID-контроллер или весь сервер целиком, и часто единственный вариант, когда оригинальная плата снята с поставки.

Вы выезжаете на площадку в ЦОД или офис?

Да. Многие задачи решаются выездом инженера: снятие логов iDRAC/iLO/IPMI, замена БП в резервировании, чистка и термопаста, диагностика бэкплейна и питания. Если нужен стенд и нагрузочное тестирование 4–8 часов, забираем узел в лабораторию и возвращаем после стресс-теста.

Сколько занимает восстановление RAID-массива?

Зависит от уровня массива, числа выпавших дисков и объема. Сначала мы снимаем образы всех дисков, чтобы не потерять данные, затем собираем массив на стенде. Типовые случаи RAID 5/6/10 занимают от 1 до 3 рабочих дней; сложные — дольше. Сроки и риски для данных фиксируем в КП до начала работ.

Вы работаете с юрлицами и через ЭДО?

Да. Для компаний доступны счет, договор, КП до ремонта, акт и электронный документооборот. По паркам серверов оформляем абонентское обслуживание с SLA, чтобы простой и сроки реакции были закреплены документально.

Что если ремонт невыгоден?

Если восстановление дороже или ненадежнее замены — например, выгорела значительная часть платы или нужен снятый с поставки компонент несоразмерной стоимости, — мы скажем это до оплаты ремонта и предложим замену узла или подбор аналога. Решение остается за вами.

Какая гарантия на ремонт серверов?

Гарантия фиксируется в акте и распространяется на выполненные работы и замененные компоненты — до 12 месяцев в зависимости от характера ремонта. На восстановление данных и сборку RAID условия оговариваются отдельно, так как результат зависит от исходного состояния дисков.

Следующий шаг

Пришлите модель сервера, логи и симптомы

Инженер посмотрит System Event Log из iDRAC / iLO / IPMI, скажет, есть ли смысл в стендовой диагностике, и подскажет, как быстрее передать сервер в работу или организовать выезд на площадку.

ЗаявкаПозвонить