معرفی روش استخراج ویژگیها و اجرای الگوریتم تقویت گرادیان برای پیشبینی صفات رفتاری در حیوانات
امروزه صنعت دامداری تمرکز خود را از صرف بر افزایش تولید، به سمت تولید پایدار و بهبود رفاه حیوانات پیشبرده است. رفتار روزمره حیوانات (مانند نشخوار، تغذیه و استراحت) به عنوان شاخص کلیدی در ارزیابی سلامت و رفاه آنها شناخته میشود. با این حال، در روشهای سنتی، جمعآوری دستی دادههای رفتاری با مشاهده مستقیم با محدودیتهایی مانند نیاز به نیروی انسانی متخصص، هزینه بالا، عدم امکان پایش پیوسته، زمانبر و هزینهبر مواجه است. فناوریهای نوین مانند شتابسنجها و هوش مصنوعی (AI) این امکان را فراهم میکنند تا رفتار حیوانات بهصورت خودکار و پیوسته رصد شود. این مقاله با معرفی خط لوله ACT4Behav، روشی سیستماتیک برای پردازش دادههای شتابسنج و پیشبینی رفتار حیوانات ارائه میدهد.
مواد و روش
جمعآوری دادهها در واحد تحقیقاتی INRAE فرانسه بر روی هشت رأس بز شیری نژاد آلپاین با میانگین سن ۱۴ ماه انجام شد. حیوانات در محیطی با کف مشبک و دسترسی دائمی به آب و غذا نگهداری شدند.
شتابسنجهای سه محوره x، y و z مدل MSR145 با قابلیت ثبت داده با دقت نمونهبرداری ۵ هرتز با استفاده از چسب مخصوص به گوش حیوانات متصل شده و هر بز با اسپری شمارهگذاری شد. همزمان، ویژگیهای مرتبط با رفتارهای خاص (مانند تغییرات شتاب ناشی از حرکت فک در هنگام نشخوار) با چهار دوربین که بالای محل نگهداری بزها نصب شدند، ثبت و استخراج گردیدند.
آزمایش اصلی به مدت ۲۴ روز متوالی تنها در ساعات روشنایی (11 ساعت) انجام گرفت که هفت روز اول صرف عادتدهی حسگرها به بزها شد و تنها ۱۷ روز باقیمانده برای آنالیز نهایی استفاده شد (مجموعاً ۱۸۷ ساعت داده معتبر). هر روز با تکان دادن شتابسنجها مقابل دوربینها همزمانسازی زمانی (دقت همزمانسازی: ±۰.۱ ثانیه) انجام میشد.
گوش بخش متحرکی است که حرکات سر و بدن حیوان را بهخوبی منعکس میکند. اما از آنجایی ممکن است گوش حیوان است در حین حرکت بچرخد، با محاسبه (Magnitude)، که مقدار مطلق شتاب را بدون وابستگی به جهت حسگر محاسبه میکند، به حذف اثر چرخشهای تصادفی حسگر، تشخیص حرکات کلی بدن حیوان و کاهش خطای ناشی از تغییر جهت حسگر کمک میکند.
دادهها به بازههای زمانی ۱۰ تا ۱۲۰ ثانیهای با برچسبگذاری باینری تقسیم شد و برچسب ۰ برای رفتار هدف(مثلاً نشخوار) کمتر از ۵۰% بازهها و برچسب ۱ برای رفتار هدف در بیش از ۵۰% بازهها رخ داده باشد، تعیین شد. همچنین دادهها به دو روش تقسیم شدند: روش ۱ به صورت تقسیم زمانی که 60% داده برای آموزش، ۲۰% برای آزمایش و ۲۰% برای اعتبارسنجی در نظر گرفته شد و در روش ۲ که تقسیم بر اساس تعداد حیوان بود، شش بز برای آموزش، دو بز برای آزمایش انتخاب شدند.
توضیحات |
رابطه ُنرم شتاب |
مقدار مطلق کل شتاب، فارغ از جهت (شدت کلی حرکت بدون توجه به جهت)، |
|
میزان خم شدن سر به جلو/عقب (مثلاً هنگام تغذیه) |
|
میزان کج یا خم شدن سر به پهلو |
|
ماتریس چرخش: ماتریس ۳x۳ که جهت متوسط حسگر را نشان میدهد |
|
تمام این فرمولها در پایتون با کتابخانههای علمی پیادهسازی شدهاند. هر فرمول برای هر بازه زمانی جداگانه محاسبه میشود. با استفاده از پکیج tsfresh در پایتون (ورژن ۳.۱۰)، ۷۷۷ ویژگی مختلف برای محاسبه استخراج شد: ویژگیهای آماری (میانگین، میانه، واریانس)، ویژگیهای طیفی (تبدیل فوریه سریع برای تحلیل فرکانس)، ویژگیهای الگو (تعداد قلهها، آنتروپی، و الگوهای تکرارشونده).
تحلیل حساسیت: تأثیر عوامل مختلف (مانند اندازه بازههای زمانی یا انتخاب ویژگیها) بر عملکرد مدل بررسی شد. برای هر رفتار (مثلاً نشخوار یا ایستادن)، تنظیمات بهینه شناسایی گردید.
الگوریتم تقویت گرادیان (Gradient Boosting): الگوریتم تقویت گرادیان یک روش یادگیری ماشین است که با ترکیب چندین مدل ضعیف (معمولاً درخت تصمیم کوچک) به یک مدل قوی میرسد. مثل یک تیم کاری که هر عضو اشتباهات عضو قبلی را اصلاح میکند. (مقاومت در برابر دادههای نویزی و قابلیت کار با دادههای ابعاد بالا).
نتایج و ارزیابی
مدل توسعهیافته برای نشخوار، سر در آغل، و ایستادن بر اساس AUC (معیار ارزیابی تقویت گرادیان) عملکرد بالایی نشان داد.
تحلیل حساسیت: در رفتار نشخوار بهترین امتیاز با بازه زمانی ۱۰ الی ۲۰ ثانیهای به دست آمد. بازههای بزرگتر (مثلاً ۶۰ ثانیه) باعث کاهش AUC شدند. فیلتر کردن دادهها برای (حذف نویز) تأثیر منفی داشت. دادههای کمکی زوایا (Pitch/Roll) و دادههای چرخشی (Rotated acceleration) با میانه (Median) بهترین نتیجه را ایجاد کرد. انتخاب ۱۰۰ ویژگی برتر بالاترین AUC را داشت. کاهش تعداد ویژگیها به ۱۰ مورد، AUC را کاهش داد.
اهمیت ویژگیها (Feature Importance): در نشخوار مهمترین ویژگی، مجموع مقادیر تکرارشونده در (Rotated Accx) بود. این ویژگی الگوهای تکراری حرکات فک در حین نشخوار را شناسایی میکند.
تأثیر اندازه بازه زمانی: بازههای کوچک (۱۰-۲۰ ثانیه) برای رفتارهای کوتاهمدت (مثل نشخوار) بهتر عمل کردند. بازههای بزرگتر (۶۰ ثانیه) برای رفتارهای طولانیمدت (مثل ایستادن) مناسبتر بودند.
این مطالعه با دستیابی به دقت 83/0 AUC در تشخیص رفتار دراز کشیدن، اثربخشی سیستمهای مبتنی بر شتابسنج را نشان میدهد. هرچند کاهش 5/19 درصدی دقت در دادههای جدید، لزوم توسعه راهکارهای تکمیلی را آشکار میسازد. پیادهسازی عملی این سیستم میتواند تا ۴۰ درصد در هزینههای پایش رفتار صرفهجویی ایجاد کند و با بهینهسازیهای بیشتر، دقت تشخیص را به سطح ۹۰ درصد برساند.
یکی از محدودیتهای اصلی، حجم کم دادههای آموزشی (کاهش ۱۹.۵ درصدی دقت سیستم هنگام مواجهه با حیوانات جدید)، دوره ۲۴ روزه جمعآوری داده که صرفاً در محیط آغل و به مدت ۱۱ ساعت که در روز انجام شده، نمیتواند تنوع کامل رفتارهای حیوان در شرایط مختلف را پوشش دهد (جمعآوری داده در محیطهای متنوع مانند مراتع و شرایط آبوهوایی مختلف نیز به افزایش قابلیت اطمینان سیستم کمک خواهد کرد). نصب روی گوش که حرکات سر را بهتر ثبت میکند اما ممکن است در تشخیص حرکات بدن مانند دراز کشیدن در زمانی که سر حیوان تکان نمیخورد دچار خطا شود. قیمت هر شتابسنج حدود ۳۰۰ دلار به همراه هزینه نگهداری (برای مزارع بزرگ مقرونبهصرفه نیست) است. توسعه حسگرهای کمهزینه میتواند امکان به کارگیری گسترده این سیستم را فراهم آورد. ضعف در تشخیص رفتارهای ترکیبی (وقتی حیوان همزمان نشخوار میکند و پا میزند مدل گیج میشود). عدم تشخیص علل رفتار (فقط چه رفتاری را تشخیص میدهد نه چرا آن رفتار اتفاق افتاده، بعنوان مثال نمیتواند بین نشخوار عادی و نشخوار ناشی از استرس تفاوت قائل شود).
با این حال، سوالات تحقیقاتی مهمی باقی مانده است که نیازمند بررسیهای بیشتر هستند. چگونه میتوان تفاوتهای فردی در رفتار حیوانات را در مدلها لحاظ کرد؟ چه راهکارهایی برای کاهش اثر نویز در دادههای شتابسنج وجود دارد؟ و چگونه میتوان این سیستم را برای گونههای مختلف استانداردسازی کرد؟
اما با این حال، این پژوهش با ارائه چارچوب ACT4Behav که ترکیبی از دادههای شتابسنج، پردازش پیشرفته و الگوریتمهای یادگیری ماشین است، گامی مهم در جهت نظارت خودکار بر رفاه حیوانات محسوب میشود. این فناوری با کاهش وابستگی به مشاهدات دستی، امکان رصد رفتار حیوانات را در مقیاس وسیعتر و با دقت بالاتر فراهم میکند. با وجود پتانسیل بالای این سیستم در بهبود رفاه حیوانات و کاهش هزینههای تولید، کاربردیسازی آن در صنعت مستلزم رفع محدودیتهای کنونی از طریق توسعه حسگرهای کمهزینه، الگوریتمهای چندمنظوره و افزایش حجم دادههای آموزشی است.