Использование микробиомных методов машинного обучения для улучшения контроля за здоровьем почвы.

 Advancing Soil Health Monitoring: Leveraging Microbiome-Based Machine Learning for Enhanced Agricultural Sustainability

“`html

Мониторинг здоровья почвы с использованием машинного обучения на основе микробиомов:

Здоровье почвы критично для поддержания экологической и коммерческой ценности агроэкосистем, требуя оценки биологических, химических и физических свойств почвы. Традиционные методы мониторинга этих свойств могут быть дорогими и непрактичными для регулярного анализа. Однако микробиом почвы предлагает богатый источник информации, который можно анализировать экономично с использованием высокопроизводительного секвенирования.

Практические решения и ценность:

Это исследование исследует потенциал моделей машинного обучения, в частности случайного леса (RF) и метода опорных векторов (SVM), для прогнозирования 12 ключевых метрик здоровья почвы, включая состояние обработки и текстуру почвы, с использованием данных ампликонов гена 16S рРНК. Модели проявили сильные прогностические способности, достигнув значения Kappa примерно 0,65 для категориальных оценок и значения R² около 0,8 для числовых прогнозов, особенно преуспевая в прогнозировании биологических метрик здоровья почвы перед химическими и физическими.

Исследование также рассматривает проблемы и лучшие практики обработки данных микробиома для применения в ML. Было установлено, что модели, обученные на высшем таксономическом разрешении, были наиболее точными, и что общие техники обработки данных, такие как редуцирование и агрегирование таксонов, могут снизить точность прогнозирования. Ключевые микробные таксоны, такие как Pyrinomonadaceae и Nitrososphaeraceae, были выявлены как важные факторы точности модели, коррелирующие с известными показателями здоровья почвы. Диагностика на основе микробиома может предоставить масштабируемый и эффективный инструмент для мониторинга здоровья почвы, предлагая практическое решение для регулярной оценки свойств почвы и принятия устойчивых сельскохозяйственных практик.

Методы:

Была проведена комплексная оценка здоровья почвы с использованием 949 образцов почвы с различных сельскохозяйственных угодий США и Канады в соответствии с рекомендациями протокола Comprehensive Assessment of Soil Health (CASH). Для поддержания целостности композиции микробиома образцы были гомогенизированы, высушены на воздухе и проанализированы в течение двух месяцев в Лаборатории здоровья почвы Корнеллского университета. Каждый образец прошел тщательный анализ, охватывающий 12 ключевых биологических, химических и физических метрик здоровья почвы, которые впоследствии были нормализованы и категоризированы для практического использования в управлении. Общее ДНК было извлечено с использованием набора PowerSoil DNeasy, а затем произведено количественное определение. Бактериальные сообщества были профилированы путем секвенирования области V4 гена 16S рРНК. Данные секвенирования были обработаны с использованием QIIME2, используя DADA2 для присвоения вариантов ампликонных последовательностей (ASV) и таксономии, используя базу данных Silva. Для подготовки данных к дальнейшему анализу были использованы методы, такие как редуцирование, пропорциональность, нормализация CSS и фильтрация разреженности для создания пяти различных типов наборов данных.

Разработаны модели обучения с учителем машинного обучения, в частности RF и L2-регуляризованные метод опорных векторов (SVM) для прогнозирования метрик здоровья почвы, практик обработки и текстуры почвы на основе данных микробиома. Рабочий процесс моделирования включал масштабирование функций, выполнение 80:20 разделения обучающих и тестовых выборок, повторяемых несколько раз для обеспечения надежности, и выбор оптимальных гиперпараметров через кросс-валидацию. Производительность модели оценивалась с использованием статистики Kappa для задач классификации и значений R² для регрессии. Важность функций была определена с использованием подхода leave-one-out для выявления ключевых таксонов, вносящих вклад в прогностическую точность. Лучшие модели были проверены на независимых наборах данных из исследований Musgrave Farm и Pastureland, продемонстрировав их обобщаемость.

Резюме оценки ML-модели на основе микробиома почвы:

Континентальное исследование почвенного микробиома сельскохозяйственных угодий Северной Америки оценило прогностическую точность ML-моделей с использованием данных микробиома почвы. SVM преуспел в классификации здоровья почвы, в то время как RF показал лучшие результаты в задачах регрессии. Нормализация глубины чтения и таксономическое разрешение значительно влияли на точность модели. Самыми предсказательными признаками были конкретные ASV, связанные с метриками здоровья, такими как активный углерод. Кросс-валидация с независимыми наборами данных подтвердила надежность моделей, особенно для прогнозирования биологических метрик. Микробиомы почвы показали значительное географическое разнообразие, причем химические свойства являлись основными причинами различий в составе сообщества.

Потенциал и вызовы моделей ML на основе микробиомов для прогнозирования здоровья почвы:

Это исследование подчеркивает потенциал использования моделей ML на основе микробиомов для прогнозирования метрик здоровья почвы. Анализ 16S рРНК почвенных микробиомов показал, что хотя эти модели могли эффективно прогнозировать биологические метрики здоровья, их точность в отношении химических и физических метрик была ниже. Модели столкнулись с проблемами из-за узкого диапазона значений pH почвы и недостаточного представления экстремальных состояний здоровья почвы в наборе данных. Улучшение точности этих моделей потребует лучшего представления разнообразных состояний здоровья почвы, особенно в экстремальных случаях, и преодоления трудностей при обработке почв с низкими показателями здоровья, которые обычно более филогенетически разнообразны.

Несмотря на эти вызовы, исследование заключает, что модели ML на основе микробиомов показывают потенциал в дополнении или потенциально замене традиционных оценок здоровья почвы, особенно в биологических метриках. Полученные результаты указывают на то, что с появлением большего количества данных, особенно региональных или управленческих, точность этих моделей улучшится. Исследование также подчеркивает необходимость разработки высокопроизводительных методов сбора данных о микробиоме, особенно для почв с низкими выходами ДНК. В то время как линейные SVM L2 превзошли RF в задачах классификации, RF модели преуспели в задачах регрессии, указывая на отсутствие четкого предпочтения к конкретному алгоритму ML в прогнозировании здоровья почвы. Будущие исследования и применение подходов ML на основе микробиомов в рамках здоровья почвы могут улучшить цифровое сельское хозяйство и обеспечить комплексную оценку здоровья почвы.

Проверьте статью. Вся заслуга за этот исследовательский проект принадлежит исследователям этого проекта.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект