Бихме искали да споделим синтезирано, знанията ни, базирани на дългогодишен опит и огромен обем информация, с част от която, някои от Вас са запознати, относно какво е BGA чип, как е устроен, защо и как дефектира и какви са причините за това, съответно как следва да се ремонтира платка с дефектирал такъв чип, ако говорим за надежност и коректност на сервизната услуга :
Ние сме твърдо убедени, че дефектите не се дължат на възникнала лоша спойка към платката освен ако не са налице окиси от заливане или влага, механичен удар и др. Причините за това са научно и световно доказани и включват неправилно производствено проектиране, включващо използването на недостатъчно издържливи и качествени материали, като чиповете дефектират в спойките на самите кристали, а не в спойките към платката. Доста от сервизите дават някои от изброените или и 3-те варианта за ремонт:
1. Презапояване, без да се „реболва” чипа
2. „Реболване” на чипа и връщане на платката, като наблягат на този метод
3. Най-скъп метод , който рядко се прилага от сервизите и, който ние единствено прилагаме - подмяна изцяло на чипа с гарантирано чисто нов
Ще започнем с това, как е устроен така нареченият Flip chip, който за по-кратко ще наричаме само чип:

Накратко имаме кристал (die) в най горната част или самия силициев чип, подложка (substrate) – зелената приличаща на стъклопластика част, която е изградена от комплексен многослоен материал, през който сигналите преминават от площадките на кристала към площадките от долната страна към платката. При “flip chip” технологията за връзки за запояване се използват сфери (топченца) от калаена сплав , които се намират под самия кристал (за разлика от SMD package и Chip-on-board на картинката), като тези към дънната платка (solder balls) са по-големи – най-често 0.35-0.6мм. и са средно 1000 на брой, а за връзка между кристала и субстрата (solder bumps)са много по-малки ~ 0.05мм - 0.1мм и са над 1000, най-често 2000, достигащи и над 5000 на брой, в зависиомост от конкретния чип, тоест в пъти по-миниатюрни и в пъти с по-голяма гъстота върху нищожната площ на силициевия кристал, и затова ще наблегнем първо на тях, ако всичко с тях е наред би следвало и с по-малкото на брой и по-големи на размер да няма проблеми свързани с явленията, които учени са установили. Това което е отбелязано като „underfill”е специален материал, с който се залива странично кристала и служи за допълнителна механична здравина и връзка на кристала към подложката, допринася за по-равномерна разпределение на температурния стрес, както и за предпазване на спойките му (bumps)към субстрата от влага .
Какво се случва при работно състояние в този “Flip Chip”, отново подчертавам накратко и общо казано, имаме за цел, не да кажем колко знаем за чиповете, а как дефектират и как не би следвало да се ремонтират такива платки:
При подаване на работните напрежения, чипът консумира енергия, а като страничен и нежелан ефект се отделя топлина, като за това последствие всеки чип трябва да има подходящо охлаждане , дотук всичко е ясно . . . но сега ще се позовем на някои научно доказани факти.
Консумацията на енергия в съвременните чипове е неравномерна, тъй като различни части от чипа са различно натоварени в различни моменти от време, а някой дори изобщо, например , ако не сте геймър, вероятно няма никога да “стоплите” транзисторите свързани с по-тежките 3D операции, казвам го простичко и илюстрирам с инфрачервена снимка на чип в многоядрен процесор, където ясно е видно гореизложеното :
[img src="http://intecs.bg/data/uploads/filemanager/pics/guess_the_chip_thermal_pic.jpg" >Разбира се картинката се променя и в различни моменти от време, една част от кристала е по-натоварена, в друг момент друга, респективно електрическите сигнали натоварват една част от връзките кристал-подложка, както и подложка-дънна платка, това е и целта им, да провеждат тези сигнали и тъй като всяка връзка (bump или ball)имат лимит на проводимост, те винаги са дублирани толкова пъти колкото е необходимо да не се достигне този лимит и да може да се осигури надежна работа на чипа, това би трябвало да е разчетено от производителите и проектантите, но какво се случи в последните години ?
Една от причините за грешен подход при ремонтите е точно, защото знаехме много малко или имахме знания базирани на производството на платки и чипове, от по-старо поколение, с далеч по-дълъг жизнен цикъл и наистина 90% от дефектите бяха свързани с лоша спойка на SMD или BGA компонент, изключвам повреди от пробив от свръхнапрежение или външна намеса, тук разискваме само работата при нормални условия, но подчертавам за над 5 понякога и 10г , съпоставено с лавината от дефектирали чипове в платки след 2006-2008г. над 50% , от които още преди да е изтекла едногодишната им гаранция ?!? Не виждаме основание някой да твърди, че това са милиони лоши спойки към платката, където както споменахме размерите на контактните повърхности са доста по-стабилни и спойките в пъти по-големи от тези на бъмповете. Причината за бързото им дефектиране се крие в производствения процес на чипове, визирам съвременните, с особено голяма степен на интеграция флип чипове. Няма да се спираме подробно на състава и свойствата на материалите, за подробности може да се поровите в Wikipedia и Google има тонове, както противоречива, така и ценна информация.
Официално производители като HP,Dell и др. спечелиха дело срещу Nvidia, и тъй като Nvidia е лидер в дефектиралите чипове , следвани от Ati, обединили се в уникален тандем с AMD, ще започнем от тях като специално наблягаме на материала , от който са изработени бъмповете (все още не намирам подходящ превод за solder bumps) , тоест сферите от калаена сплав между кристала и подложката / субстрата и респективно контактните площадки към кристала и субстрата, чрез които са запоени един към друг:
- В дефектиралите чипове на Nvidia се използват бъмпове/връзки с така наречено “high lead” или високо съдържание на олово ( 95%Pb/5%Sn ) , които по късно бяха заменени със по-ниско оловна сплав (63%Sn/37%Pb) с “eutectic” свойства (и за eutectic не намираме подходящ превод), като 2 от най-важните свойства на “eutectic” сплавта са , че тези материали имат ниска точка на топене и всичките компоненти в сплавта кристализират при една и съща температура, което пък означава, че са по лесни за работа и образуват по-здрав контакт
- Факт е също, че почти всички субстрати/подложки използват „eutectic” контактни площадки които се спояват много по-добре към бъмпове със същите свойства, от колкото към “high lead” бъмпове , неизвестно за никой е защо Nvidia е използвала “high lead” бъмпове за подложките си
- От друга страна сплавите с по-високо съдържание на олово имат по-голям капацитет на електрическо натоварване, за което споменах по горе и би било по-икономически изгодно за производителите, както и факта , че са по малко податливи на феномена „електромиграция” , феномен, който според много учени пък е основната причина за краха на почти всички Nvidia и Ati чипове произведени в този период. Този феномен представлява буквално изместване на материал в конкретния случай от бъмпа, тоест от електронния поток се изместват метални атоми към анода, причинявайки стрес, който рано или късно довежда до загуба на контакт при този вид сплави, а при размерите на контактните повърхности това даже се пресмята и без много висша математика, контактния материал буквално изчезва и прекъсва.
- Ето как изглежда явлението на снимка направена със електронен сканиращ микроскоп :



-На първата снимка е показано, как само през една двойка бъмпове се пропуска електричество, на втората снимка, движението на електронен поток е от дъното към горния десен ъгъл(анода).
На следващата, точно в този десен горен аноден ъгъл на бъмпа възниква калаена кристализация, друго явление под името „tin whisker” също все още без превод на български и без обяснение от учените по света, известно само като феномен
-На третата снимка електронният поток във вторият бъмп е с посока надолу през горния ляв ъгъл като се е формирало прекъсване по дължината на катодната контактна повърхост
Прочелите внимателно дотук, едва ли още имат съмнения в коя част от чипа първо възниква нещо „разрушително” да го наречем, но да добавим и температурния стрес и високата честота , при които работи това флип „чудо” и процесите многократно се ускоряват :
Ето и още една , този път рентгенова и илюстрирана подобен дефект снимка :
-Термичното разширение в материалите при загряване е всеизвестен факт, а при различните такива, че е различно, също. Може би няма нужда, да напомням за неравномерното натоварване в кристала, оттам неравномерно загряване и, за да е още по-интересно и разликата в температурите, колкото и минимални да са, но все пак измерими под и над кристала съответно водят до механични натоварвания на тези бъмпове, което е също един от критичните фактори и основна причина чипът да дефектира . В повечето случаи, доста от чиповете са проектирани да работят на близки до критичните гранични температурни стойности и след по-сериозно замърсяване в охладителната система процесите водещи до дефектиране на чипа се ускоряват многократно. За редуциране на този стрес се използва “underfill” , който накратко споменах в структурата на чипа, лепило-подобна субстанция около кристала, укрепваща го към субстрата/подложката, но и там проблемите не са никак малко. Изборът на диелектрик за материал с подходящи качества, твърдостта му например, ако е прекалено мек, няма да има никаква здравина, ако е прекалено твърд , при температурни и механични флуктуации биха се скъсали бъмпове и т.н. принуждава водещите производители да потърсят нови и по-надежни материали, За тези които са обръщали внимание, различни ревизии на един и същ чип е с различен цвят “underfill” , има и “Т” и “R”температурно по-издържливи ревизии и т.н.
Всичко това не са наши заключения и произволни извадки от google, това е максимално кратък синтезиран анализ, целта на който е да убеди тези, които смятат, че дефект възниква в спойка към платката и предлагат/ползват този евтин подход за ремонт или поне да ги накара да се замислят колко продължителен като трайност би бил ефекта при този вид ремонт. Според нас, той е некоректен и го предлагат най-вече колеги с липса на апаратура или познания, които с помощта на пистолет за горещ въздух за сваляне на боя презапояват, ако могат и реболват чипа, правят и разни други обилни на флюс манипулации, след които, при късмет, ако не са „убили” напълно чипа или дънната платка, единствената причина чипът, дънната платка и съответно лаптопът да запалят и поработят, макар и кратко, не повече от 2 седмици, при късмет и месец. Причината да пработи е, че в някаква степен с температурата изпозлвана да презапоят целия чип, са възстановили временно прекъсналите контакти между кристала и подложката, но тези контакти вече представляват не повече от фин допир на нещо безформено и деформирано, както е на снимката илюстрираща електромиграционен процес, целия чип потъмнява или се надува , а “underfill”-a освен, че потъмнява или пожълтява, често се пука и вече не изпълнява функциите си и ако нещо трябва да се реболва, това е кристала, а е невъзможно може би дори и във фабрични условия.
Има един единствен начин да се възстанови платка с дефектирал чип, чипсет или видеокарта, а той е да се подмени с гарантирано нов чип. Условията за подмяна на какъвто и да е флип чип, не могат да бъдат осигурени от пистолет за въздух, тъй като не се постига равномерно нагряване, да не говорим че истиснките машини за това използват поне 2 или 3 зони за подгрев под и над платката, температурата се следи и регулира автоматично от системата при това поотделно за всяка зона и отделно на няколко места на платката, има специален стенд предотвратяващ деформирането на платката и оттам запояването накриво на чипа. Следва да се почисти остатъчния флюс, доколкото е възможно, тъй като има корозионни свойства и след време води до нови проблеми, да се направи щателна визуална инспекция, ако не за къси съединения, понеже се изисква специализирана апаратура, поне за деформация на платката и надути слоеве, да се профилактира и възстанови охладителната система и контактите към радиаторите, като не се връщат старите силиконови подложки, които почти винаги са скъсани или изпечени, препоръчително е да се ползват медни пластини и термопроводящи пасти с коефициент на топлопроводимост > 4W/m °K, имали сме случаи тази подмяна да свали с повече от 20гр. работната температура на процесори и чипсети !
В заключение следва да споделим още една истина относно надежността, колкото и да сме се постарали и да сме спазили максимално процесът, на подмяна на дефектирал с нов чип, не бива да забравяме, че колкото и висококачествен да е ремонтът и чипът, ние или колегите спазващи този начин на работа сме върнали системата ви в надежно работно състояние, но не сме я направили вечна. Това, което Ви гарантираме като клиенти е, че при всички положения няма да обикаляте сервизите всяка седмица или месец за рекламация или да плащате многократно за едно и също нещо, което не е решение на проблема!