هوشمندسازی تحلیل داده‌های مواد پیشرفته با توسعه کتابخانه پایتون نانومواد

هوشمندسازی تحلیل داده‌های مواد پیشرفته با توسعه کتابخانه پایتون ایرانی نانومواد

در چارچوب طرح‌های توسعه فناوری نانو و هوشمندسازی پژوهش‌های مواد پیشرفته، پروژه‌ای با عنوان «توسعۀ مواد نانویی پیشرفته با بهره‌گیری از علم داده» به مدیریت دکتر مالک نادری، عضو هیئت‌علمی دانشگاه صنعتی امیرکبیر، از سال قبل شروع شده و تا آبان ماه ورژن دوم آن منتشر خواهد شد. هدف این طرح، توسعه یک کتابخانه علمی متن‌باز پایتون در حوزه مهندسی مواد و نانوساختارها است که تنها با یک خط کد، تحلیل داده‌های مواد، تبدیل‌های مهندسی و مدل‌های یادگیری ماشین را در دسترس پژوهشگران قرار می‌دهد. این پروژه، نخستین گام برای ایجاد زیرساخت نرم‌افزاری بومی در علم مواد مبتنی بر داده‌های نانویی است و می‌تواند مبنای شکل‌گیری یک پایگاه داده ملی آنالیزی برای تحقیقات آینده کشور باشد.

استفاده از هوش مصنوعی و یادگیری ماشین در تحلیل داده‌های مواد، یکی از مؤثرترین مسیرهای پیشرفت در علم مواد مدرن محسوب می‌شود. اما به‌کارگیری این روش‌ها مستلزم دسترسی به کتابخانه‌های تخصصی، توابع محاسباتی و داده‌های معتبر است؛ موضوعی که این پروژه به‌طور مستقیم به آن پاسخ می‌دهد.

در دهه اخیر، پژوهش‌های مرتبط با نانومواد به‌سرعت گسترش یافته‌اند و حجم عظیمی از داده‌های تجربی، محاسباتی و شبیه‌سازی‌شده در پایگاه‌های بین‌المللی منتشر شده است. با این حال، نبود ابزارهای تحلیلی یکپارچه و بومی برای مهندسان و پژوهشگران ایرانی، مانع از بهره‌برداری مؤثر از این داده‌ها در مسیر توسعه صنعتی شده است. در راستای سیاست‌های کلان ستاد ویژه توسعه فناوری نانو برای پیوند میان فناوری داده، هوش مصنوعی و علم مواد، این پروژه‌ تعریف شده است که نقطه شروعی برای ایجاد زیرساخت‌های نرم‌افزاری بومی در حوزه مهندسی مواد و نانوساختار به‌شمار می‌رود.

پروژه حاضر با هدف ایجاد یک کتابخانه علمی پایتون متن‌باز و بومی‌سازی‌شده در حوزه مهندسی مواد و نانوساختارها طراحی شده است؛ کتابخانه‌ای که پژوهشگر می‌تواند تنها با یک خط کد، به ابزارهای محاسباتی، داده‌های علمی و مدل‌های تحلیلی پیچیده دسترسی یابد.

این کتابخانه علمی، مجموعه‌ای از ماژول‌های محاسباتی و تحلیلی است که تمرکز آن بر ثابت‌های علمی مواد، تبدیل‌های مهندسی، توابع داخلی، و تحلیل داده‌های تجربی و شبیه‌سازی‌شده است. هم اکنون این کتابخانه در بستر جهانی PyPI (مخزن رسمی کتابخانه‌های پایتون) همراه با مستندات جامع به زبان انگلیسی انتشار یافته است که در آبان ماه ۱۴۰۴ ورژن دوم بجای ورژن ابتدایی قرار خواهد گرفت به انضمام مستندات فارسی؛ هدف به‌روزرسانی و گسترش طیف وسیعی از تحلیل‌ها و اتصال به دیتابیس‌های بیشتر است.

به اعتقاد مجری این طرح، این کتابخانه نه‌تنها ابزارهای محاسباتی کلاسیک را ارائه می‌دهد، بلکه به‌صورت هوشمند از الگوریتم‌های یادگیری ماشین برای تحلیل داده‌های نانومواد استفاده می‌کند. کاربران قادر خواهند بود داده‌های حاصل از آزمون‌های آزمایشگاهی یا شبیه‌سازی‌های مولکولی را با این ابزار تحلیل و الگوهای رابطه بین ساختار و ویژگی‌های ماده را استخراج کنند.

این سامانه نرم‌افزاری چهار ماژول کلیدی دارد:

ماژول ثابت‌های مرتبط با نانومواد: شامل بیش از ۵۰۰ ثابت فیزیکی و مهندسی مربوط به نانومواد و ۲۵ کلاس پایه برای تعریف ساختار نانوساختارهای صفر، یک و دوبعدی متداول و  ابزار تحلیل بیش از ۴۰ دستگاه آزمایشگاهی است.

ماژول تحلیل داده‌های آزمایشگاهی و اتصال به پایگاه‌های جهانی: این بخش قابلیت اتصال مستقیم به پایگاه‌های داده بین‌المللی مانند Crystallography Open Database (COD) ،NIST ،AFLOW، و Materials Project را دارد و همچنین از داده‌های داخلی آزمایشگاه گام‌ (GAM Lab) پشتیبانی می‌کند.

ماژول یادگیری ماشین برای نانومواد: الگوریتم‌های یادگیری تحت نظارت برای پیش‌بینی رابطه‌ی میان پارامترهای فرایند، ساختار و خواص فیزیکی ـ شیمیایی مواد (مانند رسانایی، هدایت گرمایی یا مقاومت مکانیکی) در این بخش تعبیه شده است. همچنین از روش‌های یادگیری بدون نظارت برای خوشه‌بندی و تشخیص الگو در داده‌های بزرگ مانند طیف‌های رامان یا داده‌های پراکندگی نوری استفاده می‌شود.

ماژول تبدیل‌ها و توابع مهندسی: این بخش ابزارهای محاسباتی عمومی مانند تبدیل‌های واحد، محاسبات ترمودینامیکی، روابط بین اندازه دانه، انرژی سطحی، چگالی، ضریب نفوذ و سایر توابع مورد نیاز در تحلیل‌های مهندسی مواد را فراهم می‌کند.

به اعتقاد مدیر این پروژه، توسعه این کتابخانه نخستین گام عملی در مسیر هوشمندسازی علم مواد در ایران است. چنین زیرساختی می‌تواند دانشگاه‌ها، پژوهشگاه‌ها و تیم‌های صنعتی فعال در حوزه مواد پیشرفته را به سمت کاربردی‌سازی یادگیری ماشین در پژوهش‌های خود سوق دهد.

از سوی دیگر، این پروژه زیرساختی برای ایجاد یک پایگاه داده ملی آنالیزی محسوب می‌شود؛ به‌طوری‌که داده‌های تولیدشده در مراکز تحقیقاتی داخلی بتوانند در قالبی استاندارد و قابل تحلیل ذخیره و بازیابی شوند. در آینده، توسعه این کتابخانه می‌تواند به همگرایی داده‌های نانوفناوری کشور و تقویت همکاری‌های علمی بین‌المللی بینجامد.

در عین حال، از مهم‌ترین چالش‌های پروژه می‌توان به لزوم تداوم به‌روزرسانی کتابخانه در صورت تغییر ترکیب تیم توسعه اشاره کرد. پایداری و استمرار در نگهداری چنین ابزارهایی برای تضمین دقت علمی و فنی آن‌ها حیاتی است.

در نهایت می‌توان گفت که این پروژه را می‌توان سنگ‌بنای ایجاد زیرساخت نرم‌افزاری ملی در حوزه مهندسی مواد دانست؛ بستری که نه‌تنها دسترسی پژوهشگران ایرانی به ابزارهای هوش مصنوعی را تسهیل می‌کند، بلکه زمینه را برای ادغام علم داده با علم مواد در مقیاس صنعتی فراهم می‌سازد.

با تکمیل این طرح، ایران در مسیر توسعه ابزارهای بومی تحلیل داده در فناوری‌نانو گام بلندی برخواهد داشت و می‌تواند به یکی از مراکز فعال در حوزه هوش مصنوعی مواد (Materials AI) در منطقه تبدیل شود.