Many cases are currently being reported where HP Proliant DL380 G6 servers are rebooting unexpectedly. The symptom is that the servers appear to reboot/reset for unknown reason. No hardware errors are logged, no events are captured in the IML, and the server does not ASR. The OS will log any errors applicable for when an unexpected reboot occurs, and that is all. Typically there will be events such as Server reset, Server power removed, and Server power restored in the iLO2 Event logs Solution This issue is currently under investigation by ISS Engineering. If you have any cases that match the problem description, please elevate the case to ISS GCC and reference this article. Before elevating, perform all standard applicable troubleshooting and check all relevant logs. Any cases where hardware errors, ASR events, machine check exceptions, etc are reported are considered not to be relevant to this issue and should be diagnosed as normal. For any cases that do appear to be related to this issue, there is a workaround that appears to prevent the reboots from happening in many cases. Not all cases are resolved by this workaround, but it is important to attempt the workaround in all cases to help stabilise the servers. The workaround is to go to RBSU and change the 'HP Power Profile' setting to 'Maximum Performance'. Changing this setting does not negatively impact performance or operation of the server. The only side effect will be that the server is not able to take advantage of power saving technology and the associated savings in energy costs. Replacing hardware should NOT be performed without first elevating to ISS GCC because in most cases it is seen not to resolve the issue. Therefore, using parts to attempt to resolve this issue will create parts supply issues for any other unrelated cases where it is more appropriate to replace parts. When elevating to ISS GCC, have the following information available. Operating system: Install base: (how many DL380 G6 servers does the customer have) How many servers affected: List of serial numbers: (noting affected or unaffected for each) Frequency of problem: Parts replaced: Does changing Power Profile to Maximum Performance resolve problem: (yes/no/untried) HPS Report, CFG2HTML, etc, must be provided so that GCC can accurately assess if your particular case is related to this issue. Cases elevated without appropriate information will be rejected as per standard elevation processes. UPDATE ISS Engineering have released the following statement on this issue. “HP have found an issue with limited number of DL380 G6 platforms with a component that has timing issue as a result causing the system to reboot during normal operation. We resolved this issue via PAL Code. HP currently has a quick release utility with GCC teams for implementation. We are working on an Engineering Advisory and a utility that could be utilized by customers as well as delivery mechanism.” The utility has been provided to ISS GCC. The update is considered a controlled release, and is for use by HP personel only. As the update requires an onsite visit by HP, use of the utility on any case requires a screening process to ensure appropriate use of resources and to confirm validity of its requirement. All suspected cases of this issue require elevation to ISS GCC to confirm the issue. All confirmed cases require changing the Power Profile setting in the BIOS first. Only after confirmation is received that the workaround has not resolved the problem can the utility be provided. This is to ensure appropriate prioritisation of cases due to the number of customers affected. UPDATE 26TH NOV ISS Engineering are still working on the public release of the utility to update the code with the relevant fix for this issue. No ETA is currently available. An Engineering Advisory is expected to be made available around the same time as the public release of the update. The v98 version of the code that is applied by the controlled release utility is the same code that will be included in the public release. Therefore, any system that has had the controlled release applied is not expected to require any further action, and after a suitable monitoring period (which should be determined based on the previously observed problem frequency) the case should be closed as resolved. The only difference expected from the public release is that the utility that performs the update will be further developed so that it is suitable for application by the public. At this stage it is expected that any system that has the code update applied will have the problem resolved and no further system reboots are to be expected. However, please note that intermittent reboots with no specific errors can potentially be caused by hardware problems not related to the issue discussed in this article. Therefore if problems do continue after applying the update, standard troubleshooting for this type of symptom should be performed, as the cause would likely be unrelated to this issue. Many cases are currently being reported where HP Proliant DL380 G6 servers are rebooting unexpectedly. The symptom is that the servers appear to reboot/reset for unknown reason. No hardware errors are logged, no events are captured in the IML, and the server does not ASR. The OS will log any errors applicable for when an unexpected reboot occurs, and that is all. Typically there will be events such as Server reset, Server power removed, and Server power restored in the iLO2 Event logs Solution This issue is currently under investigation by ISS Engineering. If you have any cases that match the problem description, please elevate the case to ISS GCC and reference this article. Before elevating, perform all standard applicable troubleshooting and check all relevant logs. Any cases where hardware errors, ASR events, machine check exceptions, etc are reported are considered not to be relevant to this issue and should be diagnosed as normal. For any cases that do appear to be related to this issue, there is a workaround that appears to prevent the reboots from happening in many cases. Not all cases are resolved by this workaround, but it is important to attempt the workaround in all cases to help stabilise the servers. The workaround is to go to RBSU and change the 'HP Power Profile' setting to 'Maximum Performance'. Changing this setting does not negatively impact performance or operation of the server. The only side effect will be that the server is not able to take advantage of power saving technology and the associated savings in energy costs. Replacing hardware should NOT be performed without first elevating to ISS GCC because in most cases it is seen not to resolve the issue. Therefore, using parts to attempt to resolve this issue will create parts supply issues for any other unrelated cases where it is more appropriate to replace parts. When elevating to ISS GCC, have the following information available. Operating system: Install base: (how many DL380 G6 servers does the customer have) How many servers affected: List of serial numbers: (noting affected or unaffected for each) Frequency of problem: Parts replaced: Does changing Power Profile to Maximum Performance resolve problem: (yes/no/untried) HPS Report, CFG2HTML, etc, must be provided so that GCC can accurately assess if your particular case is related to this issue. Cases elevated without appropriate information will be rejected as per standard elevation processes. UPDATE ISS Engineering have released the following statement on this issue. “HP have found an issue with limited number of DL380 G6 platforms with a component that has timing issue as a result causing the system to reboot during normal operation. We resolved this issue via PAL Code. HP currently has a quick release utility with GCC teams for implementation. We are working on an Engineering Advisory and a utility that could be utilized by customers as well as delivery mechanism.” The utility has been provided to ISS GCC. The update is considered a controlled release, and is for use by HP personel only. As the update requires an onsite visit by HP, use of the utility on any case requires a screening process to ensure appropriate use of resources and to confirm validity of its requirement. All suspected cases of this issue require elevation to ISS GCC to confirm the issue. All confirmed cases require changing the Power Profile setting in the BIOS first. Only after confirmation is received that the workaround has not resolved the problem can the utility be provided. This is to ensure appropriate prioritisation of cases due to the number of customers affected. UPDATE 26TH NOV ISS Engineering are still working on the public release of the utility to update the code with the relevant fix for this issue. No ETA is currently available. An Engineering Advisory is expected to be made available around the same time as the public release of the update. The v98 version of the code that is applied by the controlled release utility is the same code that will be included in the public release. Therefore, any system that has had the controlled release applied is not expected to require any further action, and after a suitable monitoring period (which should be determined based on the previously observed problem frequency) the case should be closed as resolved. The only difference expected from the public release is that the utility that performs the update will be further developed so that it is suitable for application by the public. At this stage it is expected that any system that has the code update applied will have the problem resolved and no further system reboots are to be expected. However, please note that intermittent reboots with no specific errors can potentially be caused by hardware problems not related to the issue discussed in this article. Therefore if problems do continue after applying the update, 5000/5000 Максимальное количество символов: 5000 В настоящее время сообщается о многих случаях неожиданной перезагрузки серверов HP Proliant DL380 G6. Симптом состоит в том, что серверы перезагружаются / сбрасываются по неизвестной причине. Аппаратные ошибки не регистрируются, события не регистрируются в IML, и сервер не выполняет ASR. ОС будет регистрировать любые ошибки, связанные с непредвиденной перезагрузкой, и это все. Обычно в журналах событий iLO2 происходят такие события, как сброс сервера, отключение питания сервера и восстановление питания сервера. Решение Эта проблема в настоящее время расследуется компанией ISS Engineering. Если у вас есть какие-либо случаи, которые соответствуют описанию проблемы, пожалуйста, поднимите случай до ISS GCC и обратитесь к этой статье. Перед повышением выполните все стандартные применимые методы устранения неполадок и проверьте все соответствующие журналы. Любые случаи, когда сообщается об ошибках оборудования, событиях ASR, исключениях проверки компьютера и т. Д., Рассматриваются как не относящиеся к этой проблеме, и их следует диагностировать как нормальные. Для любых случаев, которые, по-видимому, связаны с этой проблемой, существует обходной путь, который, по-видимому, предотвращает перезагрузку во многих случаях. Не все случаи решаются с помощью этого обходного пути, но важно попытаться обойти во всех случаях, чтобы помочь стабилизировать серверы. Обходной путь - перейти в RBSU и изменить настройку «Профиль мощности HP» на «Максимальная производительность». Изменение этого параметра не оказывает негативного влияния на производительность или работу сервера. Единственным побочным эффектом будет то, что сервер не сможет воспользоваться преимуществами технологии энергосбережения и связанной с этим экономии энергозатрат. Замена оборудования НЕ должна выполняться без предварительного повышения до GCC ISS, потому что в большинстве случаев проблема не решается. Следовательно, использование деталей для решения этой проблемы создаст проблемы с поставками деталей для любых других несвязанных случаев, когда более целесообразно заменить детали. При поднятии на МКС GCC, иметь следующую доступную информацию. Операционная система: Установить базу: (сколько серверов DL380 G6 имеет клиент) Сколько серверов затронуто: Список серийных номеров: (отмечая затронутые или не затронутые для каждого) Частота проблемы: Части заменены: Устраняет ли изменение профиля мощности на максимальную производительность: (да / нет / не проверено) Необходимо предоставить отчет HPS, CFG2HTML и т. Д., Чтобы GCC мог точно оценить, связан ли ваш конкретный случай с этой проблемой. Случаи, повышенные без соответствующей информации, будут отклонены в соответствии со стандартными процессами повышения. ОБНОВИТЬ Компания ISS Engineering выпустила следующее заявление по этому вопросу. «HP обнаружила проблему с ограниченным количеством платформ DL380 G6 с компонентом, в результате которого возникла проблема с синхронизацией, в результате чего система перезагружалась во время нормальной работы. Мы решили эту проблему с помощью кода PAL. В настоящее время у HP есть утилита быстрого выпуска с командами GCC для реализации. Мы работаем над технической консультацией и утилитой, которая может использоваться клиентами, а также механизмом доставки ». Утилита была предоставлена ??МКС GCC. Обновление считается контролируемым выпуском и предназначено только для персонала HP. Поскольку обновление требует посещения HP на месте, использование утилиты в любом случае требует процесса проверки для обеспечения надлежащего использования ресурсов и подтверждения обоснованности его требований. Все подозрительные случаи этой проблемы требуют повышения к GCC МКС, чтобы подтвердить проблему. Во всех подтвержденных случаях сначала необходимо изменить настройку профиля питания в BIOS. Утилита может быть предоставлена ??только после получения подтверждения того, что обходной путь не решил проблему. Это необходимо для обеспечения правильной расстановки приоритетов в связи с количеством пострадавших клиентов. ОБНОВЛЕНИЕ 26 НОЯБРЯ ISS Engineering все еще работает над публичным выпуском утилиты, чтобы обновить код соответствующим исправлением для этой проблемы. В настоящее время ETA недоступно. Ожидается, что техническая рекомендация будет доступна примерно в то же время, что и публичная версия обновления. Версия кода v98, применяемая утилитой управляемого выпуска, - это тот же код, который будет включен в публичный выпуск. Следовательно, от любой системы, в которой применен контролируемый сброс, не ожидается каких-либо дальнейших действий, и после подходящего периода мониторинга (который должен быть определен на основе ранее наблюдаемой частоты проблем) дело должно быть закрыто как разрешенное. Единственное отличие, ожидаемое от публичного выпуска, заключается в том, что утилита, которая выполняет обновление, будет доработана, чтобы она была пригодна для публичного применения. На этом этапе ожидается, что в любой системе, в которой применено обновление кода, проблема будет решена и дальнейших перезагрузок системы не ожидается. Тем не менее, обратите внимание, что периодические перезагрузки без особых ошибок могут быть вызваны проблемами с оборудованием, не связанными с проблемой, обсуждаемой в этой статье. Поэтому, если проблемы не исчезнут после применения обновления,