مقایسه مقاومت بتن با الیاف فولادی و بتن معمولی با استفاده از الگوریتم های یادگیری ماشین
kazemi31217۱۴۰۲/۶/۱۵ ،۲۱:۲۱:۴۶ +۰۴:۳۰مقیاسبندی دادهها و شکافت
بعد از ساخت مجموعه دادهای، این مجموعه داده به دو گروه تقسیم شد. اولین گروه مجموعه آموزشی بود که در مدلهای آموزشی نقش داشت. گروه دوم، مجموعه آزمون بود. مجموعه آزمون برای مقایسه داده با نتایج حاصل از پیشبینی مدل یادگیری ماشین بهعنوان مجموعه آموزشی استفاده شد. در این بررسی، مجموعه آموزشی و مجموعه آزمون به نسبت 8:2 تقسیم شدند. اوی[1] و همکاران [2] بیان نمودند که مقیاس بندی بعد از تقسیم دادهها به مجموعههای آموزشی و آزمونی اجرا میشود تا از نشت دادهای جلوگیری شود. از این رو، داده هر مقدار به یک توزیع نرمال استاندارد مقیاسبندی شد، چون دامنه و یکاهایمقدارها متفاوت بود. مدلدوباره با نرمافزار استاندارد اسکالر[2] مقیاسبندی شد. این نرم افزار تابعی در یادگیری ماشینی اسکیکیت لرن[3] است.که میانگین را به صفر و انحراف استاندارد را به 1 تبدیل میکند.
3 روششناسی
1-3 روش ارزیابی
برای ارزیابی صحت الگوریتمهای یادگیری- ماشین خطای جذر میانگین مربعات، خطای مطلق میانگین و خطای درصد مطلق میانگین در نظر گرفته شدند.
1-1-3 خطای جذر میانگین مربعات:
در رگرسیون، تابع زیان معمولاً در خطای جذر میانگین مربعات بکار میرود. این تابع بصورت زیر تعریف میشود:
که در آن y مقدار پیش بینی است، y مقدار واقعی است و n تعداد نمونههای دادهای است. هر چه خطا بیشتر باشد، مقدار خطای جذر میانگین مربعات بیشتر خواهد بود و صحت پیشبینیها قابل تخمین است. معمولاً خطای جذر میانگین مربعات، هنگامی که مقدار پیشبینی شده مدل با مقادیر واقعی تفاوت داشته باشند بکار میرود. بعلاوه، کارایی مدل زمانی که مقدار خطای جذر میانگین مربعات کوچکتر باشد بهتر خواهد بود.
2-1-3 خطای مطلق میانگین
خطای مطلق میانگین، میانگین حسابی انحراف است که بصورت مقدار مطلق منهای میانگین کل هر اندازهگیری بیان میشود.
3-1-3 خطای درصد مطلق میانگین
خطای درصد مطلق میانگین یک روش ارزیابی است که مکمل معایب خطاهای وابسته به اندازه خطای مطلق میانگین است و با فرمول زیر تعریف میشود:
2-3 ارزیابی اعتبار متقابل
بیش برازش به معنای عدم توانایی برای کاربرد دادههای اضافی است. علت این امر ایجاد نتایج تحلیلی است که بسیار به یک مجموعه داده نزدیک یا کاملاً با آن یکسان و منطبق هستند [3].بیش برازش برای مقاصد پیشبینی کاربرد ندارد، و بخوبی برای دادههای نمونهای مورد استفاده در یادگیری- ماشین تخمین زده میشود. اما اگر دادهها جدید باشند بخوبی پیشبینی نمی شوند. اگر تعداد داده کوچک باشد و تعداد اعتبارسنجی داده نیز کم باشد، افزایش تعداد دادههای اعتبارسنجی قابل اطمینان نیست و اثبات نرمال بودن توزیع دشوار است. روش تصدیق بهمنظور حل این مشکلات استفاده از اعتبار سنجی متقابل k مرتبهای است [4,5].
اعتبارسنجی متقابل kمرتبهای مراحل اعتبارسنجی و یادگیری ماشین را تکرار میکند:
- همه دادهها را به 5 زیرمجموعهD2} D1 D3 D5D4} تقسیم کنید.
- از دادههای D2} D1 D3 D4} بهعنوان دادههای یادگیری برای ایجاد مدل رگرسیون استفاده کنید و از دادههای } D5} برای اعتبارسنجی متقابل استفاده نمایید.
- برای ایجاد یک مدل رگرسیون و اعتبارسنجی متقابل با مجموعه دادهای } D5}از دادههای D2} D3 D1D4}بهعنوان دادههای یادگیری استفاده کنید.
- از داده های D2} D3 D5D4}به عنوان دادههای یادگیری برای ساخت مدل رگرسیون و از دادههای} D1}برای اعتبار سنجی متقابل استفاده کنید. این فرایند تکرار میشود تا همه دادهها بکار روند.
- این فرایند باعث ایجاد کلاً k مدل و اعتبارسنجی متقابل k میشود. کارایی نهایی اعتبارسنجی متقابل با متوسطگیری از کارایی تصدیق متقابل این k مدل محاسبه میشود. در شکل 2 تشریح شماتیک اعتبارسنجی 5 مرتبه ای نشان داده شده است.
دیدگاهتان را بنویسید