B2B · серверы и СХД · Москва и МО

Ремонт серверов и СХД в Москве и МО

Board-level ремонт серверов Dell PowerEdge, HP ProLiant, Supermicro и СХД: блоки питания, RAID-контроллеры, восстановление массивов, бэкплейны, память ECC и контроллеры iDRAC / iLO / IPMI. Выезд инженера, SLA, КП и документы.

Прислать логи iDRAC / iLO +7 (995) 905-64-28

Board-level ремонтВыезд в ЦОД и офисSLA от 4 часовКП, договор, ЭДО

Стендовая диагностика серверной платы и RAID-контроллера в лаборатории РемФикс

Нагрузочный тест 4–8 ч

Вывод инженера

Отказал узел питания, сервер ремонтопригоденКП, сроки и гарантия фиксируются до старта.

0 ₽первичная оценка по логам

от 4 чSLA на реакцию по парку

RAIDконтроллеры, кэш, массивы

B2BКП, счет, акт и гарантия

Серверная плата и RAID-контроллер на лабораторном стенде — Remfix LabИнженер Remfix Labсерверы, RAID, питание, BMC и нагрузочные тесты

Лаборатория

Сервер смотрим по логам, питанию и поведению под нагрузкой

У серверов часто нет одного очевидного виновника: отказ может быть в PSU, VRM, RAID-контроллере, бэкплейне, памяти ECC, BMC или охлаждении. Поэтому начинаем с логов iDRAC/iLO/IPMI и заканчиваем стресс-тестом.

Инженер Remfix LabСначала защищаем данные и фиксируем риски. Для RAID работаем через образы дисков, для железа — через логи, питание, бэкплейн и длительную проверку под нагрузкой.

разбор SEL из iDRAC, iLO, IPMI и POST-кодов
диагностика PSU, VRM, RAID, бэкплейна, памяти ECC и BMC
стресс-тест питания, памяти и дисковой подсистемы перед выдачей

SEL

Системные логи

Смотрим ошибки PSU, VRM, FAN, ECC, BMC, RAID и температуру до разбора.

RAID

Массивы и данные

Перед восстановлением массива снимаем образы, чтобы не усугубить потерю данных.

BURN

Стресс-тест

После ремонта проверяем сервер 4–8 часов под нагрузкой.

Что ремонтируем

Board-level ремонт вместо дорогой замены узла

Когда оригинальная плата, RAID-контроллер или бэкплейн сняты с поставки, компонентный ремонт часто быстрее и дешевле.

PSU

Блоки питания серверов

Замена силовых ключей, ШИМ-контроллеров, конденсаторов и дежурки в БП Delta, Lite-On, Artesyn и оригинальных PSU.

RAID

RAID-контроллеры и кэш

PERC, Smart Array, MegaRAID, ServeRAID: ремонт платы, замена кэш-памяти, BBU/суперконденсаторов и батареек.

Storage

Восстановление RAID и СХД

Развалившиеся RAID 0/1/5/6/10, выпавшие диски, деградация и rebuild. Снимаем образы и собираем массив на стенде.

Mainboard

Материнские платы и бэкплейны

Серверные платы Dell, HP, Supermicro и SAS/SATA/NVMe-бэкплейны: VRM, разъемы, слоты памяти и дисковые каналы.

ECC

Память ECC и слоты

Диагностика ошибок ECC, поиск сбойного модуля или слота DIMM, ремонт линий памяти и VRM.

BMC

IPMI, iDRAC и iLO

Контроллеры удаленного управления: нет доступа, ошибки BMC, потеря лицензии и сетевого порта управления.

Cooling

Охлаждение и термопаста

Чистка от пыли, замена термопасты и термопрокладок, ремонт серверных вентиляторов и PWM-цепей.

Backplane

Бэкплейны и экспандеры

SAS-экспандеры и дисковые корзины: пропадают диски, ошибки на бэкплейне, битые линии, разъемы питания и данных.

Симптомы

Когда сервер надо диагностировать на стенде

Логи обычно заранее показывают область отказа, но плавающие сбои ловятся только нагрузочным тестом.

сервер не стартует, не доходит до POST или уходит в защиту по питанию

пищит POST-кодами, моргает индикатором или зависает на инициализации

ошибки в iDRAC / iLO / IPMI: CPU, VRM, PSU, FAN, память или BMC

деградация RAID, выпал диск, массив не собирается или идет бесконечный rebuild

ECC-ошибки памяти, сбойный модуль DIMM или нерабочий слот

перегрев и троттлинг, разгон вентиляторов на максимум, аварийное выключение

блок питания в защите, не запускается резервирование 1+1 или мигает оранжевым

пропадают диски в корзине, ошибки на SAS-бэкплейне или экспандере

Процесс

От логов сервера до стресс-теста

Для серверов важно не потерять данные и не вернуть плавающую неисправность клиенту. Поэтому ремонт заканчивается проверкой под нагрузкой.

Оставить заявку

Логи и вводные

Снимаем System Event Log из iDRAC / iLO / IPMI, POST-коды и описание сбоя.

Первичная оценка

Инженер по логам и фото говорит, есть ли смысл в стендовой диагностике, какие риски для данных и можно ли решить вопрос выездом.

Стендовая диагностика

Проверяем питание, силовую часть, RAID-контроллер, бэкплейн и память. Под нагрузкой ловим плавающие отказы.

КП и согласование

Фиксируем дефектовку, список работ, сроки, стоимость, гарантию и порядок работы с данными.

Ремонт и восстановление

Board-level пайка, замена силовых ключей, конденсаторов и кэша, сборка RAID, ремонт бэкплейна и цепей питания памяти.

Стресс-тест и акт

Прогоняем память, диски и питание, проверяем целостность массива, передаем акт и рекомендации.

Сценарии

Серверные сценарии, где важна скорость реакции

В ЦОД, офисе или производстве простой сервера быстро становится дороже ремонта.

Сервер не стартует после грозы

Скачок по питанию выбил дежурку БП, VRM или цепи на материнской плате. Снимаем логи, находим выгоревший узел и восстанавливаем питание board-level.

Развалился RAID, нужны данные

Выпало несколько дисков, массив не собирается, идет нескончаемый rebuild. Сначала снимаем образы дисков, потом собираем RAID на стенде и достаем данные.

Парк серверов на SLA

Стойка серверов в ЦОД или офисе, простой считается в деньгах. Берем парк на обслуживание, держим SLA от 4 часов и работаем по договору и ЭДО.

Кейсы

Как выглядит нормальная дефектовка

Не обещаем чудо по телефону. Фиксируем симптом, узел, ремонтное действие и результат, чтобы клиент понимал, за что платит.

VRM

Dell PowerEdge не доходил до POST

Симптом: сервер включал вентиляторы на максимум и зависал до инициализации.
Что сделали: по SEL и измерениям нашли отказ цепи питания, восстановили VRM и проверили плату.
Результат: сервер прошел стресс-тест, клиент получил акт и список замененных компонентов.

данные

RAID 5 ушел в деградацию после rebuild

Симптом: один диск выпал, второй начал сыпать ошибками во время восстановления массива.
Что сделали: сняли образы дисков, собрали массив на стенде и восстановили доступ к данным.
Результат: данные вернули, клиент получил рекомендации по замене дисков и контроллера.

BMC и охлаждение

HP ProLiant держал вентиляторы на 100%

Симптом: сервер работал, но шумел на максимуме и показывал ошибку датчика.
Что сделали: проверили iLO, датчики, вентиляторы и цепь управления охлаждением.
Результат: обороты нормализовались, перегрев и ложная авария ушли.

Стоимость

Ориентиры до диагностики

Стоимость зависит от узла, рисков для данных, необходимости выезда и длительности нагрузочного теста.

Первичная оценка по логам iDRAC/iLO0 ₽

Диагностика на стендеот 4 900 ₽

Ремонт серверного блока питанияот 5 900 ₽

Ремонт RAID-контроллераот 7 900 ₽

Замена / ремонт бэкплейнаот 8 900 ₽

Восстановление RAID-массиваот 9 900 ₽

Абонентское обслуживание / SLAпо задаче

Срочный выезд инженера по Москвепо задаче

Оборудование

Серверы, СХД и контроллеры

Для оценки пришлите модель сервера, логи iDRAC/iLO/IPMI, фото ошибок и конфигурацию RAID.

Dell PowerEdgeHP ProLiantSupermicroLenovo ThinkSystemCisco UCSHuawei FusionServerFujitsu Primergy

ИБП для серверных Промышленная электроника Замена АКБ ИБП

Быстрый расчёт

Оставьте телефон — инженер оценит сервер по логам

Укажите модель, ошибку, что видно в iDRAC/iLO/IPMI, конфигурацию RAID и приложите фото или экспорт логов.

+7 (995) 905-64-28 WhatsApp Telegram

FAQ

Вопросы перед ремонтом серверов

Коротко о board-level ремонте, выезде, RAID и документах.

Чем board-level ремонт отличается от замены узла?

При board-level ремонте мы находим конкретный неисправный элемент на плате — силовой ключ, ШИМ-контроллер, конденсатор, кэш RAID или цепь VRM — и меняем именно его. Это дешевле и быстрее, чем менять весь узел целиком.

Вы выезжаете на площадку в ЦОД или офис?

Да. Многие задачи решаются выездом инженера: снятие логов iDRAC/iLO/IPMI, замена БП, чистка, термопаста, диагностика бэкплейна и питания. Если нужен стенд, забираем узел в лабораторию.

Сколько занимает восстановление RAID-массива?

Зависит от уровня массива, числа выпавших дисков и объема. Сначала снимаем образы всех дисков, затем собираем массив на стенде. Типовые случаи RAID 5/6/10 занимают от 1 до 3 рабочих дней; сложные — дольше.

Вы работаете с юрлицами и через ЭДО?

Да. Для компаний доступны счет, договор, КП до ремонта, акт и электронный документооборот. По паркам серверов оформляем абонентское обслуживание с SLA.