در چارچوب طرحهای توسعه فناوری نانو و هوشمندسازی پژوهشهای مواد پیشرفته، پروژهای با عنوان «توسعۀ مواد نانویی پیشرفته با بهرهگیری از علم داده» به مدیریت دکتر مالک نادری، عضو هیئتعلمی دانشگاه صنعتی امیرکبیر، از سال قبل شروع شده و تا آبان ماه ورژن دوم آن منتشر خواهد شد. هدف این طرح، توسعه یک کتابخانه علمی متنباز پایتون در حوزه مهندسی مواد و نانوساختارها است که تنها با یک خط کد، تحلیل دادههای مواد، تبدیلهای مهندسی و مدلهای یادگیری ماشین را در دسترس پژوهشگران قرار میدهد. این پروژه، نخستین گام برای ایجاد زیرساخت نرمافزاری بومی در علم مواد مبتنی بر دادههای نانویی است و میتواند مبنای شکلگیری یک پایگاه داده ملی آنالیزی برای تحقیقات آینده کشور باشد.
هوشمندسازی تحلیل دادههای مواد پیشرفته با توسعه کتابخانه پایتون ایرانی نانومواد
استفاده از هوش مصنوعی و یادگیری ماشین در تحلیل دادههای مواد، یکی از مؤثرترین مسیرهای پیشرفت در علم مواد مدرن محسوب میشود. اما بهکارگیری این روشها مستلزم دسترسی به کتابخانههای تخصصی، توابع محاسباتی و دادههای معتبر است؛ موضوعی که این پروژه بهطور مستقیم به آن پاسخ میدهد.
در دهه اخیر، پژوهشهای مرتبط با نانومواد بهسرعت گسترش یافتهاند و حجم عظیمی از دادههای تجربی، محاسباتی و شبیهسازیشده در پایگاههای بینالمللی منتشر شده است. با این حال، نبود ابزارهای تحلیلی یکپارچه و بومی برای مهندسان و پژوهشگران ایرانی، مانع از بهرهبرداری مؤثر از این دادهها در مسیر توسعه صنعتی شده است. در راستای سیاستهای کلان ستاد ویژه توسعه فناوری نانو برای پیوند میان فناوری داده، هوش مصنوعی و علم مواد، این پروژه تعریف شده است که نقطه شروعی برای ایجاد زیرساختهای نرمافزاری بومی در حوزه مهندسی مواد و نانوساختار بهشمار میرود.
پروژه حاضر با هدف ایجاد یک کتابخانه علمی پایتون متنباز و بومیسازیشده در حوزه مهندسی مواد و نانوساختارها طراحی شده است؛ کتابخانهای که پژوهشگر میتواند تنها با یک خط کد، به ابزارهای محاسباتی، دادههای علمی و مدلهای تحلیلی پیچیده دسترسی یابد.
این کتابخانه علمی، مجموعهای از ماژولهای محاسباتی و تحلیلی است که تمرکز آن بر ثابتهای علمی مواد، تبدیلهای مهندسی، توابع داخلی، و تحلیل دادههای تجربی و شبیهسازیشده است. هم اکنون این کتابخانه در بستر جهانی PyPI (مخزن رسمی کتابخانههای پایتون) همراه با مستندات جامع به زبان انگلیسی انتشار یافته است که در آبان ماه ۱۴۰۴ ورژن دوم بجای ورژن ابتدایی قرار خواهد گرفت به انضمام مستندات فارسی؛ هدف بهروزرسانی و گسترش طیف وسیعی از تحلیلها و اتصال به دیتابیسهای بیشتر است.
به اعتقاد مجری این طرح، این کتابخانه نهتنها ابزارهای محاسباتی کلاسیک را ارائه میدهد، بلکه بهصورت هوشمند از الگوریتمهای یادگیری ماشین برای تحلیل دادههای نانومواد استفاده میکند. کاربران قادر خواهند بود دادههای حاصل از آزمونهای آزمایشگاهی یا شبیهسازیهای مولکولی را با این ابزار تحلیل و الگوهای رابطه بین ساختار و ویژگیهای ماده را استخراج کنند.
این سامانه نرمافزاری چهار ماژول کلیدی دارد:
ماژول ثابتهای مرتبط با نانومواد: شامل بیش از ۵۰۰ ثابت فیزیکی و مهندسی مربوط به نانومواد و ۲۵ کلاس پایه برای تعریف ساختار نانوساختارهای صفر، یک و دوبعدی متداول و ابزار تحلیل بیش از ۴۰ دستگاه آزمایشگاهی است.
ماژول تحلیل دادههای آزمایشگاهی و اتصال به پایگاههای جهانی: این بخش قابلیت اتصال مستقیم به پایگاههای داده بینالمللی مانند Crystallography Open Database (COD) ،NIST ،AFLOW، و Materials Project را دارد و همچنین از دادههای داخلی آزمایشگاه گام (GAM Lab) پشتیبانی میکند.
ماژول یادگیری ماشین برای نانومواد: الگوریتمهای یادگیری تحت نظارت برای پیشبینی رابطهی میان پارامترهای فرایند، ساختار و خواص فیزیکی ـ شیمیایی مواد (مانند رسانایی، هدایت گرمایی یا مقاومت مکانیکی) در این بخش تعبیه شده است. همچنین از روشهای یادگیری بدون نظارت برای خوشهبندی و تشخیص الگو در دادههای بزرگ مانند طیفهای رامان یا دادههای پراکندگی نوری استفاده میشود.
ماژول تبدیلها و توابع مهندسی: این بخش ابزارهای محاسباتی عمومی مانند تبدیلهای واحد، محاسبات ترمودینامیکی، روابط بین اندازه دانه، انرژی سطحی، چگالی، ضریب نفوذ و سایر توابع مورد نیاز در تحلیلهای مهندسی مواد را فراهم میکند.
به اعتقاد مدیر این پروژه، توسعه این کتابخانه نخستین گام عملی در مسیر هوشمندسازی علم مواد در ایران است. چنین زیرساختی میتواند دانشگاهها، پژوهشگاهها و تیمهای صنعتی فعال در حوزه مواد پیشرفته را به سمت کاربردیسازی یادگیری ماشین در پژوهشهای خود سوق دهد.
از سوی دیگر، این پروژه زیرساختی برای ایجاد یک پایگاه داده ملی آنالیزی محسوب میشود؛ بهطوریکه دادههای تولیدشده در مراکز تحقیقاتی داخلی بتوانند در قالبی استاندارد و قابل تحلیل ذخیره و بازیابی شوند. در آینده، توسعه این کتابخانه میتواند به همگرایی دادههای نانوفناوری کشور و تقویت همکاریهای علمی بینالمللی بینجامد.
در عین حال، از مهمترین چالشهای پروژه میتوان به لزوم تداوم بهروزرسانی کتابخانه در صورت تغییر ترکیب تیم توسعه اشاره کرد. پایداری و استمرار در نگهداری چنین ابزارهایی برای تضمین دقت علمی و فنی آنها حیاتی است.
در نهایت میتوان گفت که این پروژه را میتوان سنگبنای ایجاد زیرساخت نرمافزاری ملی در حوزه مهندسی مواد دانست؛ بستری که نهتنها دسترسی پژوهشگران ایرانی به ابزارهای هوش مصنوعی را تسهیل میکند، بلکه زمینه را برای ادغام علم داده با علم مواد در مقیاس صنعتی فراهم میسازد.
با تکمیل این طرح، ایران در مسیر توسعه ابزارهای بومی تحلیل داده در فناورینانو گام بلندی برخواهد داشت و میتواند به یکی از مراکز فعال در حوزه هوش مصنوعی مواد (Materials AI) در منطقه تبدیل شود.