برادران چراغچی پس از اینکه با ساخت نمونه اول رم، نتیجه نگرفتند، دست از کار نکشیدند و شروع به تحلیل و عیبیابی کردند که مشکل عدم کارکرد قطعه را شناسایی کنند. صالح چراغچی در این زمینه میگوید:
ما موارد خیلی زیادی رو بررسی کردیم . به نتایجی رسیدیم که تصور کردیم مشکل رو شناسایی کردیم. نمونه بعدی PCB رو مجدد به کارخانه تایوانی سفارش دادیم و سری دوم رمهایی رو که تولید کردیم هم باز کار نکرد و نتیجه نداد! از اونجایی که پارامترهای زیادی وجود داشت واقعا سردرگم بودیم. ما خط تولید رو به صورت دستی راهاندازی کرده بودیم. مثلا دستگاه Oven که قطعه در داخل اون قرار میگیره تا خمیر قلع روی بورد طبق پروفایل دمایی خاصی دماش بالا و پایین بره و ذوب بشه رو ما با یه توستر خونگی درست کرده بودیم. توش سنسور و مدار کنترلی گذاشته بودیم. مثلا سر همین موضوع من خودم کلی رفته بودم تحقیق کرده بودم که الگوریتمهای کنترل دما چطوری هستن. مثلا راحتترینش این بود که اگر به یک دمای خاصی رسید المنت خاموش بشه. خوب اما مشکل اینجا بود که وقتی برق المنت قطع می شد المنت همچنان داغ بود و دما کمی بالاتر میرفت و پایینتر هم که باید روشن میشد هم کمی طول میکشید که دما شروع به بالا رفتن کنه. در نتیجه ما یک پروفایل دمایی سینوسی با اختلاف دمای زیادی داشتیم. برامون سوال شد که اونهایی که دقیق هستن چکار میکنن؟ بعد از بررسی فهمیدیم که اونها یه سری الگوریتمهایی دارن به نام PID که این الگوریتمها یه بخششون قطع و وصله و یه بخششون انتگرال و یه بخششون مشتقه. تازه فهمیدیم که انتگرال و مشتق هم یه جایی به درد میخوره! حتی اندازهگیری و کالیبره کردن اون دمای داخل دستگاه هم خودش دغدغه ما بود! یا مثلا در نظر میگرفتیم که ۸ تا BGA روی بورد هست که هرکدوم ۷۶تا پایه داره که یکی از اونها پایههاش درست متصل نباشه رم کار نمیکنه. ذهنمون خیلی درگیر بود و همه چیز رو چندین بار بررسی میکردیم.
برای اطمینان از اینکه ایرادی در قطعات وجود ندارد، تمامی قطعات با چندین برابر قیمت خریداری شده بودند و شرکت تولیدکننده PCB نیز با دوبرابر قیمت بوردها را تولید و مورد ارزیابیهای مختلف و تستهای اتصال و امپدانس و غیره قرار داده بود. اما همچنان مشکلات پابرجا بود و تیم تولید در حال بررسی سناریوهای مختلف بود. منطق مدار کامل درست بود اما کار نمیکرد. در یکی از جلسات همفکری که این دو برادر در خودرو و راه کرج تهران برگزار میکردند یک جرقهای در ذهنشان ایجاد شد:
ما تعداد ۱۵ تا ماژول تولید کرده بودیم که یکی از رمها بعد از چندین بار روشن و خاموش کردن ماردبورد روشن شد و تصویر بر روی لوگوی مادربورد ثابت موند. جالب اینجا بود که از هر ۱۰ بار خاموش و روشن کردن یک بار این اتفاق میافتاد. در اون زمان ایسوس یک مادربوردی تولید کرده بود B75 با یه پسوندی که خاطرم نیست، این مادربورد یه دکمه MemTest یا MemOK داشت که میومد رم رو با یه سری پارامترهای جدید تست میکرد. مثلا فرکانس رو بالا و پایین میکرد یا زمان تأخیرها رو تغییر میداد. اون شب تو ماشین قرار گذاشتیم که با این مادربورد چک کنیم. من فردا صبحش دیر رفتم، اما بچهها صبح اول وقت که رسیده بودن رم رو روی مادربورد B75 گذاشته بودن و دکمه تست رو هم زده بودن و اون مادربورد بعد از چندبار چک کردن بالاخره پارامترای درست رو ست کرده بود و سیستم بوت شده بود و ویندوز اومده بود بالا! من خودم وقتی اومدم دیدم تصویر داره دستام یخ کرده بود.
تیم تولید بعد از این موفقیت متوجه شدند که از ۱۵ ماژول تولیدی ۱۳ ماژول با این شرایط و بر روی مادربورد B75 عملکرد دارد. بعد از تحلیلهای فراوان تیم تولید در نهایت به یک نتیجهگیری رسیده بودند که به دلیل تداخل و نویز دادههای انتقالی در لایههای مختلف، این شرایط به وجود میآید. در واقع از نظر علمی، در رمهای DDR3 و DDR4 و DDR5 دادهها با یک باس ۶۴ بیتی (یا ۸ بایتی) منتقل میشوند. به عبارت دیگر در هر بار ارسال، یک بسته ۶۴ بیتی ارسال میشود. از طرفی فرکانس کاری رمهای DDR3 در آن زمان ۱۶۰۰ مگاهرتز بوده است. بالا بودن فرکانس کاری در کنار باس ۶۴ بیتی باعث ایجاد تداخل در لایهها و ترکهای مختلف میشود که بر روی دادههای ترکهای دیگر اثر میگذارد و دادهها در این شرایط تغییر میکنند.
وقتی فرکانس کاری بالا میره و انتقال اطلاعات از طریق باس انجام میشه، اگر نکاتی در طراحی لحاظ نشه، ترکهایی که از کنار هم رد شدن میتونن دیتای ترک نزدیک رو تحت تاثیر قرار بدن و به یه حالت آینهای عمل میکنن. به عنوان مثال ۰ رو به ۱ تبدیل میکنن یا برعکس. برای اینکه جلوی این موضوع در طراحی مدارهای فرکانس بالا گرفته بشه برای لایههایی که باس دارن یه سری ملاحظات در نظر میگیرن مثلا بالا و پایین رو صفحات گراند در نظر میگیرن یا ضخامت دی الکتریک رو بیشتر در نظر میگیرن. ما به این نتیجه رسیدیم که همین موضوع هست و دیالکتریکی که بین صفحات باسمون بود رو ضخیمتر کردیم و لایههای گراند رو هم بیشتر کردیم. سری بعدی PCB رو سفارش دادیم و بعد از یک ماه اومد. تو خط تولیدمون مونتاژ کردیم و بالاخره جواب گرفتیم.