داستان طراحی و تولید اولین حافظه رم ساخت ایران – قسمت دوم

برادران چراغچی پس از اینکه با ساخت نمونه اول رم، نتیجه نگرفتند، دست از کار نکشیدند و شروع به تحلیل و عیب‌یابی کردند که مشکل عدم کارکرد قطعه را شناسایی کنند. صالح چراغچی در این زمینه می‌گوید:

ما موارد خیلی زیادی رو بررسی کردیم . به نتایجی رسیدیم که تصور کردیم مشکل رو شناسایی کردیم. نمونه بعدی PCB رو مجدد به کارخانه تایوانی سفارش دادیم و سری دوم رم‌هایی رو که تولید کردیم هم باز کار نکرد و نتیجه نداد! از اونجایی که پارامترهای زیادی وجود داشت واقعا سردرگم بودیم. ما خط تولید رو به صورت دستی راه‌اندازی کرده بودیم. مثلا دستگاه Oven که قطعه در داخل اون قرار می‌گیره تا خمیر قلع روی بورد طبق پروفایل دمایی خاصی دماش بالا و پایین بره و ذوب بشه رو ما با یه توستر خونگی درست کرده بودیم. توش سنسور و مدار کنترلی گذاشته بودیم. مثلا سر همین موضوع من خودم کلی رفته بودم تحقیق کرده بودم که الگوریتم‌های کنترل دما چطوری هستن. مثلا راحت‌ترینش این بود که اگر به یک دمای خاصی رسید المنت خاموش بشه. خوب اما مشکل اینجا بود که وقتی برق المنت قطع می شد المنت همچنان داغ بود و دما کمی بالاتر می‌رفت و پایین‌تر هم که باید روشن می‌شد هم کمی طول می‌کشید که دما شروع به بالا رفتن کنه. در نتیجه ما یک پروفایل دمایی سینوسی با اختلاف دمای زیادی داشتیم. برامون سوال شد که اون‌هایی که دقیق هستن چکار می‌کنن؟ بعد از بررسی فهمیدیم که اون‌ها یه سری الگوریتم‌هایی دارن به نام PID که این الگوریتم‌ها یه بخششون قطع و وصله و یه بخششون انتگرال و یه بخششون مشتقه. تازه فهمیدیم که انتگرال و مشتق هم یه جایی به درد می‌خوره! حتی اندازه‌گیری و کالیبره کردن اون دمای داخل دستگاه هم خودش دغدغه ما بود! یا مثلا در نظر می‌گرفتیم که ۸ تا BGA روی بورد هست که هرکدوم ۷۶تا پایه داره که یکی از اونها پایه‌هاش درست متصل نباشه رم کار نمیکنه. ذهنمون خیلی درگیر بود و همه چیز رو چندین بار بررسی می‌کردیم.

برای اطمینان از اینکه ایرادی در قطعات وجود ندارد، تمامی قطعات با چندین برابر قیمت خریداری شده بودند و شرکت تولید‌کننده PCB نیز با دوبرابر قیمت بوردها را تولید و مورد ارزیابی‌های مختلف و تست‌های اتصال و امپدانس و غیره قرار داده بود. اما همچنان مشکلات پابرجا بود و تیم تولید در حال بررسی سناریو‌های مختلف بود. منطق مدار کامل درست بود اما کار نمی‌کرد. در یکی از جلسات همفکری که این دو برادر در خودرو و راه کرج تهران برگزار می‌کردند یک جرقه‌ای در ذهنشان ایجاد شد:

ما تعداد ۱۵ تا ماژول تولید کرده بودیم که یکی از رم‌ها بعد از چندین بار روشن و خاموش کردن ماردبورد روشن شد و تصویر بر روی لوگوی مادربورد ثابت موند. جالب اینجا بود که از هر ۱۰ بار خاموش و روشن کردن یک بار این اتفاق می‌افتاد. در اون زمان ایسوس یک مادربوردی تولید کرده بود B75 با یه پسوندی که خاطرم نیست، این مادربورد یه دکمه MemTest یا MemOK داشت که میومد رم رو با یه سری پارامترهای جدید تست می‌کرد. مثلا فرکانس رو بالا و پایین می‌کرد یا زمان تأخیرها رو تغییر می‌داد. اون شب تو ماشین قرار گذاشتیم که با این مادربورد چک کنیم. من فردا صبحش دیر رفتم، اما بچه‌ها صبح اول وقت که رسیده بودن رم رو روی مادربورد B75 گذاشته بودن و دکمه تست رو هم زده بودن و اون مادربورد بعد از چندبار چک کردن بالاخره پارامترای درست رو ست کرده بود و سیستم بوت شده بود و ویندوز اومده بود بالا! من خودم وقتی اومدم دیدم تصویر داره دستام یخ کرده بود.

تیم تولید بعد از این موفقیت متوجه شدند که از ۱۵ ماژول تولیدی ۱۳ ماژول با این شرایط و بر روی مادربورد B75 عملکرد دارد. بعد از تحلیل‌های فراوان تیم تولید در نهایت به یک نتیجه‌گیری رسیده بودند که به دلیل تداخل و نویز داده‌های انتقالی در لایه‌های مختلف، این شرایط به وجود می‌آید. در واقع از نظر علمی، در رم‌های DDR3 و DDR4 و DDR5 داده‌ها با یک باس ۶۴ بیتی (یا ۸ بایتی) منتقل می‌شوند. به عبارت دیگر در هر بار ارسال، یک بسته ۶۴ بیتی ارسال می‌شود. از طرفی فرکانس کاری رم‌های DDR3 در آن زمان ۱۶۰۰ مگاهرتز بوده است. بالا بودن فرکانس کاری در کنار باس ۶۴ بیتی باعث ایجاد تداخل در لایه‌ها و ترک‌های مختلف می‌شود که بر روی داده‌های ترک‌های دیگر اثر می‌گذارد و داده‌ها در این شرایط تغییر می‌کنند.

وقتی فرکانس کاری بالا می‌ره و انتقال اطلاعات از طریق باس انجام میشه، اگر نکاتی در طراحی لحاظ نشه، ترک‌هایی که از کنار هم رد شدن می‌تونن دیتای ترک نزدیک رو تحت تاثیر قرار بدن و به یه حالت آینه‌ای عمل می‌کنن. به عنوان مثال ۰ رو به ۱ تبدیل می‌کنن یا برعکس. برای اینکه جلوی این موضوع در طراحی مدارهای فرکانس بالا گرفته بشه برای لایه‌هایی که باس دارن یه سری ملاحظات در نظر می‌گیرن مثلا بالا و پایین رو صفحات گراند در نظر می‌گیرن یا ضخامت دی الکتریک رو بیشتر در نظر می‌گیرن. ما به این نتیجه رسیدیم که همین موضوع هست و دی‌الکتریکی که بین صفحات باسمون بود رو ضخیم‌تر کردیم و لایه‌های گراند رو هم بیشتر کردیم. سری بعدی PCB رو سفارش دادیم و بعد از یک ماه اومد. تو خط تولیدمون مونتاژ کردیم و بالاخره جواب گرفتیم.

دیدگاهتان را بنویسید