Выражение «железо глючит» стало универсальным объяснением любых проблем с компьютером. И часто это объяснение верно, но вот что делать дальше? Ясно, что какую-то детальку надо менять, но вот какую? Обычно используется известная научная методика, больше известная в народе как «метод научного тыка», благо деталей в компьютере немного. А вот на что менять – вопрос более сложный. Существует более десятка производителей памяти, гораздо больше производителей материнских плат, даже жесткие диски выпускает как минимум пять фирм. С процессорами гораздо сложнее – есть только ADM и INTEL, причем они не взаимозаменяемы. Поэтому весь компьютерный мир разделился на три неравные части: первые считают, что процессоры AMD – это сплошной глюк; другие считают, что все проблемы – в INTEL’е; третьи уверены, что глючить могут любые процессоры, особенно Cyrix. Но мой опыт показывает, что процессоры глючат очень редко, и распознать это сложно, а большинство проблем вызвано другими причинами. Этому и посвящена данная статья.
Человеческий фактор.
В сфере авторемонта принято говорить, что все проблемы с автомобилем решаются заменой прокладки между рулем и сиденьем. В компьютерной среде обычно говорят, что надо установить драйвера – «руки.sys» и «голова.com». Проблемы, которые может создать пользователь или иной «специалист», неисчислимы, но следует отметить, что существуют люди, которые самим своим присутствием способны вызывать глюки в компьютере. Как правило, профессии этих людей никак не связаны с компьютерами, они могут быть врачами, продавцами, начальниками, секретаршами, но по службе или в быту они вынуждены сталкиваться с компьютерами. В результате с техникой происходят невероятные вещи – сгорает то, что не может сгореть, ломается то, что не может сломаться. На все вопросы такие люди отвечают: «А я ничего не делал», и действительно, их действия традиционны и обыденны, но результаты катастрофичны. В присутствии таких людей может проглючить самая надежная техника, а после их ухода техника будет работать без проблем еще лет пять. Понять это логически, а тем более бороться с этим практически невозможно, это можно только знать, а лучше чувствовать.
Астрологический фактор.
Иногда компьютеры начинают глючить без каких-либо причин, но примерно одинаково одновременно у многих. Речь не идет о понятных причинах типа «проблемы 2000» или Чернобыля. Например, если с утра пришел человек со сгоревшим блоком питания, с большой вероятностью после обеда придет еще один. Бывают черные дни, когда у многих никак не связанных между собой пользователей железо глючит похоже, одновременно и беспричинно. Наверное, в этот день просто звезды расположились неудачно. Пытаться предсказать такие дни бесполезно, к ним надо быть морально и технически готовым. Правда, бывают и светлые дни, когда без последствий сходят самые очевидные ошибки, а железо, которое давно считал дохлым, вдруг начинает работать.
Программные проблемы.
Главной программной проблемой обычно считают операционную систему WINDOWS. Я с этим не согласен, и считаю, что на нормальном, «прямом» железе Windows должна и будет работать прямо. Можно на «кривом» железе уменьшить глюки, поставив вместо XP W-98, но это не избавит от всех проблем, рано или поздно что-то вылезет.
Обычно же программные проблемы вызваны вирусами. Например, я как-то дня три ставил MS OFFICE, пока не догадался выгнать WinChih. Другой раз целый компьютерный класс вел себя криво из-за древнего OneHalf. У одного клиента Word периодически выдавал «Программа выполнила недопустимую операцию» и не сохранял документ. После замены процессора и памяти догадался проверить на вирусы – почти все доки были в макровирусе.
Проблемы с драйверами.
Обычно эти проблемы вылезают в играх – одна игра играет, другая – нет. После замены драйверов к видео и DirectX все меняется – первая игра не играет, вторая начинает играть. При этом следует учитывать, что многие игры – пиратские, и даже не окончательные релизы, а бета-версии. Да и драйвера все время выходят новые, и не всегда до конца доработанные. Проблемы с драйверами обычно касаются видеокарт, реже – звуковых.
Проблемы с видеократами.
Сейчас все проблемы с видеокартами свелись к проблеме драйверов и перегреву видеочипа. Но еще несколько лет назад серьезной проблемой была совместимость видеокарты с материнской платой. Особенно это касалось видеокарт на TNT2, которые в платах на LX или VIA693 могли вообще не завестись, или же показывали только 16 цветов. Гораздо реже такие проблемы были с 3DFX. Как правило, попытки решить эту проблему на уровне драйверов результата не дают – это несовместимость материнской платы и видеокарты. Обычно приходилось менять материнку на BX.
Еще раньше были проблемы несовместимости видеокарт и мониторов. Выражалось это в том, что изображение было черно-белым, но в некоторых приложениях цвет есть. Если несколько раз перегрузить компьютер, то цвет появляется. Классический пример такого сочетания – Trident 9000 и Samsung 3NE. Похожие проблемы были с ранними мониторами Bridge, которые стала выпускать Формоза.
Проблемы с жесткими дисками.
Умирающие жесткие диски способны вызвать глюки, похожие на зависания процессора. Это может быть общее торможение работы компьютера, например, когда умирают FUJITSU серии MPG, обычно это происходит через год-полтора после начала эксплуатации. Или же компьютер виснет намертво, и выводится из такого состояния только RESETом. Такое бывает на WD или IBM. На диске образуется плохой участок, и при форматировании или при работе, когда головки доходят до него, компьютер просто встает, при этом горит светодиод HDD. Иногда бывает даже мало RESETа, после него пишется “HDD failure”, надо выключить и включить питание. Можно сказать, что с жестким диском связана неработоспособность компьютера, если IDE-шлейф надеть не по ключу. При этом компьютер ведет себя как полностью мертвый, даже диски не раскручиваются, только светодиоды горят.
Проблемы со звуковухами и пр.
Некоторые звуковухи и другие карточки, когда дохнут, вешают шину, и компьютер при этом не заводится. Как правило, при этом дохнет только карточка, а все остальное остается живым.
Проблемы с памятью.
В последнее время это встречается часто. Как правило, WINDOWS при этом чудит с разными вариантами, в основном «Программа выполнила недопустимую операцию». Возможные варианты – «Ошибка распаковки CAB-файла», не прорисовываются окошки или иконки. Бывает, что при загрузке вылезает только BOOT-BLOCK BIOS’а, понажимаешь Reset – вроде загрузится. Если в винде за курсором тянется тень, или курсор в прямоугольнике – это проблема видеодрайверов. А вот если экран весь покрыт рябью как сеткой, или же экран покрывается случайным образом разноцветными точками или черточками – это проблемы видеопамяти. Неисправность обычной памяти можно выявить, загрузив HIMEM с тестированием памяти – например, загрузить WIN-98 в Safe Mode. Если память неисправна, то вылезет предупреждение об ошибке в памяти по такому-то адресу. Иногда через 2-3 года эксплуатации ослабевают контакты в слотах DIMM, и память начинает чудить. Помогает вытащить и протереть контакты DIMM’ов.
Проблемы с материнкой.
Приближаемся к самому интересному. Глюки мамок более хитры, менее понятны и могут проявляться время от времени. Самое простое – когда ничего просто не заводится, или же не работает какой-то порт – COM, IDE, USB. Во всяком случае ясно, в чем дело. Не работать мамка может по разным причинам – статикой выбило чипсет, стерся BIOS, села батарейка (особенно касается мамок ZIDA), механические повреждения (перебиты дорожки). Сложнее, когда мамка работает неустойчиво – виснет через некоторое время или даже перезагружается. Как правило, причина в плохом питании – или блока питания, или стабилизатора на мамке. Особенно БП подводят при большом энергопотреблении – на Атлонах или Пнях-4. Машина либо не включается с первого раза, либо выключается в случайный момент времени – срабатывает зашита от перегрузки. Если дохнет стабилизатор напряжения на мамке, то машина вообще не работает – нет напряжения на процессоре, или же напряжение существенно ниже нужного. Это определяется по холодному процессору и вольтметром, и лечится довольно легко – заменой деталек в схеме стабилизатора. Если стабилизатор глючит – то машина виснет или перезагружается случайным образом. Пример – вздувшиеся конденсаторы на мамках ABIT. На процессор идет переменка, и процессор работает нестабильно. Конденсаторы начинают пухнуть примерно через год, и машина начинает виснуть все чаще и чаще. Пухнут конденсаторы JACKCON 1500 мкф на 6.3в зеленого цвета. Лечится заменой конденсаторов. Другой пример – мамка ACORP 6VIA85P. Процессоры PPGA (напряжение питания 2в) работают нормально, FC-PGA виснут в случайный момент, даже в SETUP’е.
Основные проблемы с материнками не зависят от фирм-производителей напрямую. Бывают нюансы с конкретной партией – неверная разводка, не тот BIOS, не смыт флюс, плохая компоновка, плохие детали, как в случае с ABIT. Но от фирмы-производителя надежность работы не зависит – может сдохнуть ASUS, и годами работать ZIDA.
А теперь о проблемах процессоров.
Самое интересное и непонятное – глюки процессоров. Перегрев за глюк не считаю. Глюки, связанные с непосредственно процессорами, я бы разделил на три части:
- особенности процессоров, заложенные при проектировании;
- явные и устойчивые неисправности конкретного процессора;
- глюки, т.е. непонятные и непостоянные проявления, явно не нормальные и связанные с процессором.
Особенности процессоров, заложенные при проектировании.
Считается, что все х86-совместимые процессоры должны с точки зрения программ работать одинаково, на то они и совместимые. На самом деле это не так. Сейчас это можно объяснить происками патентоведов, т.е. Intel запатентовала какую-то особенность, и AMD не может в точности ее воспроизвести, что, естественно, отражается на поведении различных программ. Но и несколько лет назад проблема работоспособности программ на разных процессорах была актуальна, причем даже сильнее, чем сейчас. В середине 90-х очень распространены были программы, написанные на Clipper’е – СУБД под ДОС, использующей DBF-формат баз данных. Самая известная из таких программ – 1С-бухгалтерия. На Intel это работало без проблем, на AMD в общем-то тоже, а на Cyrix (тогда были в ходу Cx 5x86, по ногам совместимые с 486) не запускались вообще, отвечая что-то типа «Divide by zero», «Internal stack overflow» и пр. Вообще-то это была проблема компилятора Clipper, которую в конце концов исправили. Позднее, правда, вылезали проблемы Clipper’a с AMD K5 и Cx 6x86. Для AMD это решалось прописыванием драйвера типа AMDK5.SYS в CONFIG.SYS, для Cyrix не лечилось вообще.
Сейчас такие проблемы очень редки, даже с процессором VIA C3 (реинкарнация Cyrix), хотя в конференциях попадаются сообщения, что на новейших P-4 не идет старая бухгалтерия.
Явные и устойчивые неисправности процессоров.
В первую очередь это механические повреждения – расколот кристалл, оторваны ноги. Во вторую – термические повреждения (в основном касается AMD). Более хитрая неисправность – отгорание кеша второго уровня на слотовых камнях. Частенько это случалось на CELERON 300A – последствия разгона. Я видел P-II-233 с отгоревшим кешем второго уровня – в SETUP делаешь “External Cache – disable”, и все нормально работает. Правда, если кеш включить, то до загрузки не доходит.
Давным-давно у меня был 486DX2-50, который глючил очень хитро – дисковод вел себя совершенно необычно. В конце концов я создал на дискете два файла с одинаковым именем и расширением. Все остальное работало нормально. После замены камня все стало нормально. Скорее всего, дело было в DMA, потому что общение с дисководом идет через него.
Говорят, что DURON’ы частично портятся так, что не работает звук или DirectX. Я лично видел машину на DURON’е, на которой висло все, что использовало DirectX, например WinAmp, все остальное – офис или проигрыватель CD, работало нормально. Мне рассказывали про другую машину на DURON’е, на которой принципиально не работал звук, причем никакой – ни внешний, ни внутренний. Проблема решилась заменой камня (машина была гарантийная).
Глюки.
Самые гадкие глюки – когда то работает, то не работает. И уловить закономерность очень сложно. Например, машина на P-III-450, мать ASUS P3B-F (слотовая). Виснет в случайный момент времени, причем намертво, только RESET. Причем после RESET’а может запуститься, может просто ничего не делать – черный экран и молчок, а может запиликать сиреной, как «Скорая помощь». После долгих наблюдений удалось установить, что в какой-то момент напряжение питания ядра садится до 1.6В (норма – 2В). После долгих тестов выяснилось, что по отдельности камень и мать работают без проблем. Решилось все заменой матери на Soltek, а в ASUS’е через переходник больше года работает Cel-800. Я так думаю, что был плохой контакт в слоте процессора на тех ламельках, которые задают напряжение питания.
Другая история – P-III-800 FC-PGA 133МГц и мать на i815, не помню какая. Видео GeForce 2MX-400 бренд, но дело не в этом – через полчаса-час виснет, или перезагружается, или вообще выключается. Потом может не запуститься вообще, или попищать. Естественно, замена памяти и видео ничего не дали. Поставил Cel-950 – все работает как часы. Поставил пень на другую мать – ни единой проблемы. Поставил пень на 100МГц (получился P-III-600) – та же фигня, но пореже. Короче, заменил камень на Cel-950, а пень поставил себе домой (на Формозу i815). Три месяца работает без проблем!
Кстати, о P-III-800. Пришел человек – сдохла машина. Мать ASUS, кажется CUSI, камень – P-III-800 FC-PGA 133МГц. Естественно, подозрение на мать. А вот и нет! Сдох камень! Машине год, только что кончилась гарантия, внутрь не лазили (пыль не тронута), кулер родной, INTEL’овский. Короче, не стал грузить клиента, поставил Celeron, а пня оставил в коллекцию. Недельки через две было свободное время – думаю, дай-ка еще раз пня проверю. Засунул через переходник MSI в ASUS P2B, напряжение 1.8В поставил (P2B меньше 1.8В не выдает). Раз пять потыкал RESET – взошло! Зашел в SETUP, походил по меню – все нормально! Вышел на перезагрузку – опять мертвяк! Короче, еще раза три удалось мне этого пня запустить – и как 800, и как 600МГц, а потом надоело извращаться. Кстати, когда не запускается – практически холодный. Лежит теперь в коллекции.
Ещё одна история про P-III-800 FC-PGA 133МГц. Пришел знакомый с завода, у них там машин десять в сетке – бухгалтерия. Завод не бедный – сетка на витой паре, сетевухи 3COM, да и машины приличные – пни третьи, есть и четвертые. И вот одна машина проглючила, причем глюк хитрый – портится бухгалтерская база данных: то файл становится меньше на один байт, то некоторые байты в БД изменяются в процессе передачи с этой машины в сеть. Ну иногда еще офис виснет. Естественно, из сети эту машину убрали, потому что она своими проявлениями еще и сетку подвешивала – после того, как повиснет, вся сеть встает. Полгода они её мучили – всё бестолку. И софт переставляли (лицензионный, естественно), и сетевухи меняли, а поставят в сеть – и привет. Причём первый день работы вроде ничего, а на второй все сначала. Притащили ко мне – экспериментируй сколько влезет, всё равно полгода не работает. Мать CUSL-2C, диск QUANTUM 30G, видео VANTA 16M, корпус высокий 211, «Формоза» в таких собирать любит. Ну погонял игрушки дня три – вроде все нормально. Отдал назад – на следующий день звонят: все сначала! Ну, говорю, везите, начнем сначала. Заменил P-III-800 на Cel-800. Уехали и четыре дня ни слуху, ни духу. Звоню – говорят, все нормально! А я пня себе на SOLTEK i815 поставил, причем разогнал до 840МГц – у меня тоже четыре дня ни одной проблемы. Как говорится, продолжаю внимательно следить за развитием событий.
Вообще по своему не слишком богатому опыту скажу – пни третьи вообще не слишком надежная штука в сравнении с Celeron. AMD – отдельная история, там просто камни дохнут от перегрева. Почти у каждого, кто постоянно занимается железом, есть сгоревший AMD ( у меня тоже есть – Athlon 1200). А вот Celeron’ов дохлых видел нечасто – один раз PPGA, и пару раз FC-PGA – один просто раздавили, а второй – Cel-633 – сдох ни с того, ни с сего. Вечером работал, а утром – уже нет. Ну еще видел дохлый Cel-266 – скорее всего, оверклокеры сожгли. А пни-третьи, особенно слотовые, частенько попадаются.
Конечно, бывают экстремальные случаи – например, неисправность блока питания, когда на железо идет повышенное напряжение. Один раз лично видел, что осталось, и пару раз слышал. Короче, в импульсном БП, как мне разъяснил спец по питанию, есть обратная связь между выходными цепями и первичными, которые импульсы на трансформатор и генерят. Обратная связь сделана на оптопаре или на импульсном трансформаторе. Если обратная связь летит, то первичный генератор начинает генерить максимум того, на что способен. В результате на выходе БП напряжение увеличивается раза в три против номинала. Я видел машину, которая попала в такое состояние: Cel-300A слотовый, мать 6ABX2V, 32M памяти, диск 3.2Г FUJITSU, видео 3DFX VOODOO-3 3000, звук Creative SB16 ISA, CD Mitsumi, корпус 211. Короче, в живых остался процессор и звук. Рассказывали мне про другую похожую машину, только там был Cel-433 PPGA в переходнике. В живых остался проц и переходник. А вот пню-третьему слотовому в такой ситуации повезло меньше – как мне рассказывали, мать пошла пузырями, а камень – P-III-500 слотовый – сдох, правда, кулер живой.
Бывает, что слотовые P-III дохнут просто так. То есть причина какая-то есть, но какая – непонятно. Как-то вот таким образом сдох слотовый P-III-533 в матери, кажется, ACORP 6VIA86P. В другой матери, естественно, тоже не запускался. Человек купил такой же, а дохлый подарил мне. Короче, на следующий день у меня этот камень работал нормально. Что сделал – сказать не могу (в руках повертел). Потом, правда, ещё разок поглючил, но вот уже несколько месяцев работает нормально.
Другой P-III-500 слотовый вел себя точно так же. Сначала полный мертвяк, но потом заработал и работал долго, пока я не стал дергать его из матери в мать. После пары перестановок работать перестал. Индикатор POST-кодов на AWARD BIOS показывает коды “d4”, “d5” – и на этом встает. Стандартные приемы «плясок с бубном», почерпнутые из конференций – завернуть в фольгу, положить на батарею, сварить в воде – не помогли.
Есть у меня и Cyrix MII – 300, который ведет себя похоже – индикатор POST-кодов выдает пару кодов – и все встает. Но с Cyrix’ом по сравнению с пнем-третьим возиться менее интересно.
Теперь главный вопрос – а зачем я всю эту фигню написал? Отвечаю: кто сам таких историй может рассказать множество, пусть приколется лишний раз. А кто считает, что все эти процессоры – сложно и непонятно, пусть поймёт, что ошибается – все гораздо сложнее и непонятнее.