This research is designed to make a valuable contribution to the field of precision agriculture, by exploring the potential of state-of-the-art technologies and techniques for yield prediction in processing tomato crop. The core aim was to develop and evaluate a robust methodology incorporating cutting-edge technologies, remote sensing data, and sophisticated analytical techniques like machine learning and statistical analysis. The primary objective is to improve the accuracy and dependability of yield predictions at local and regional levels. This was achieved through a progressive approach implemented yearly, utilizing non-invasive methods to track the crop's biological cycle and refine predictive yield models.
Over the course of this study, a progressive methodology was implemented to gather data and refine methodologies. It commenced with a systematic literature review focusing on yield predictions within precision agriculture, to offer an extensive overview of the latest advancements in this domain. Simultaneously, pilot activities were conducted over three years. Ten pilot fields were chosen to integrate proximal, aerial, and satellite measurements with yield assessments in the initial two years, primarily exploring the correlation between crop yield and NDVI (Normalized Difference Vegetation Index), a widely used indicator. This phase aimed to uncover similarities between satellite technology, UAS (Unmanned Aerial System), and proximal sensors concerning crop yield evaluation. Conducting an extensive comparison of satellite, airborne, and proximal technologies, their individual strengths, and limitations were emphasized within the precision agriculture context.
During the second year, alongside the detailed investigation of specific fields using satellite, UAS, and proximal sensors at the field scale, an expanded study involved 108 fields at the regional scale, incorporating satellite data analysis. This phase aimed to assess NDVI and four additional vegetation indices (VIs) in predicting crop yield. Time series data comprising five VIs at a regional scale were deployed to explore the relationship between these indices and the critical phenological stages of the crop. Furthermore, machine learning techniques were applied to VI data collected through satellite images at different growth stages to evaluate their predictive performance for yield in industrial tomato fields. Specifically, AutoML algorithms and statistical analysis were utilized to gauge the correlation between yield and VIs retrieved from satellite datasets. The transformed data was utilized to train and test both statistical and machine learning algorithms, encompassing linear and nonlinear regression models, along with ensemble methods based on decision trees. The analysis encompassed various regression models such as ordinary least squares (OLS), Theil-Sen, and Huber, as well as tree-based methods, support vector machines (SVM), and automatic relevance determination (ARD). This broader scope aimed to deepen the understanding of crop yield estimation based on the findings from the initial systematic review.
During the third year, a more intricate approach was adopted, focusing on the evaluation of spectral bands derived from satellite imagery. Each band's individual performance in predicting crop yield was assessed, allowing for a comprehensive evaluation of their unique contributions to overall yield estimation accuracy. This granular analysis provided deeper insights into the importance and impact of each spectral band in refining the precision of crop yield predictions. The performance of both statistical and machine learning models was assessed to gain profound insights into the most efficient growth stages and VIs for precise yield prediction.
The findings of this study indicated substantial similarity between UAS and Sentinel-2 data, especially in the later stages of the crop's phenological cycle, implying a heightened agreement as the crop matured. The study identified a moderate correlation between proximal sensor data and UAS/satellite datasets, with discrepancies attributed to variances in measurement wavelengths and the specific focus area of each platform. Regarding the relationship of the VI dynamics in relation to the crop's phenological cycle, the lowest mean values for all VIs were observed shortly after transplanting, marked by limited canopy cover and exposed soil between rows. Notably, as the season progressed, canopy cover percentage gradually increased, particularly at the midpoint of the season when processing tomato crop reached their peak vigor just before reallocating sugars to their fruits.
Regarding yield prediction, the proximal sensor showed higher explanatory power during the initial canopy growth phase, while UAS and Sentinel platforms improved their performance as canopy coverage expanded. The satellite platform demonstrated superior performance during the crucial flowering stage, emphasizing its effectiveness in elucidating yield variability. The study employed basic statistics, notably the Pearson correlation coefficient, highlighting the VIs' optimal performance during specific growth stages. Additionally, machine learning algorithms were integrated to enhance yield prediction accuracy rigorously evaluated through regression analysis and a 5-fold cross-validation procedure. The research identified NDVI, RVI and SAVI as the most effective VIs for yield predictions, achieving high R² values and low RMSEs, particularly 90 days after transplanting. Ensembles comprising two regressors emerged as the optimal choice for enhanced predictive accuracy. Remarkably, band combinations of Band 4, Band 8, and Band 12 stood out. The Red Edge/NIR bands displayed notable performance, especially within the 80 to 90 days post-transplanting window, exhibiting the strongest correlation with yield.
Overall, the findings suggest that UAS and satellite sensors demonstrate greater accuracy in predicting crop yield towards the end of the season and offer increased precision during the later stages of development. In contrast, proximal sensors showcase correlations at earlier stages of crop growth. Combining data from multiple sensors and growth stages can enhance prediction accuracy. Using VI and spectral band data in conjunction with machine learning techniques may represent a more effective and economically efficient method for predicting tomato yield.
Αυτή η μελέτη έχει ως στόχο να συμβάλει στον τομέα της Γεωργίας Ακριβείας, εξερευνώντας τις δυνατότητες των προηγμένων τεχνολογιών και μεθόδων στην πρόβλεψη απόδοσης στην καλλιέργεια βιομηχανικής ντομάτας. Το κύριο εγχείρημα ήταν η ανάπτυξη και αξιολόγηση μιας αξιόπιστης μεθοδολογίας που ενσωματώνει προηγμένες τεχνολογίες, δεδομένα τηλεπισκόπησης και προηγμένες αναλυτικές τεχνικές, όπως η μηχανική μάθηση και η στατιστική ανάλυση. Ο κύριος στόχος είναι η βελτίωση της ακρίβειας και της αξιοπιστίας των προβλέψεων απόδοσης σε τοπικό και περιφερειακό επίπεδο. Αυτό επιτεύχθηκε μέσω μιας προοδευτικής προσέγγισης που εφαρμόστηκε ετησίως, χρησιμοποιώντας μη καταστροφικές μεθόδους για την παρακολούθηση του βιολογικού κύκλου της καλλιέργειας και τη βελτίωση των μοντέλων πρόβλεψης παραγωγής.
Κατά τη διάρκεια αυτής της μελέτης, εφαρμόστηκε μια προοδευτική μεθοδολογία για τη συγκέντρωση δεδομένων. Άρχισε με μια συστηματική βιβλιογραφική ανασκόπηση που εστίασε στην πρόβλεψη απόδοσης με μεθόδους Γεωργίας Ακριβείας, για να προσφέρει μια εκτενή επισκόπηση των τελευταίων εξελίξεων σε αυτόν τον τομέα. Ταυτόχρονα, πιλοτικές δραστηριότητες διεξήχθησαν για τρία χρόνια. Τα δύο πρώτα χρόνια επιλέχθηκαν δέκα πιλοτικά αγροτεμάχια για την ενσωμάτωση επίγειων, εναέριων και δορυφορικών δεδομένων και δειγματοληψίες παραγωγής, με κύριο στόχο να εξετάσουν τη συσχέτιση μεταξύ της απόδοσης της καλλιέργειας και του NDVI (Δείκτης Βλάστησης Κανονικοποιημένης Διαφοράς), ενός δείκτη που χρησιμοποιείται ευρέως. Αυτή η φάση είχε ως στόχο να εξερευνήσει τις ομοιότητες μεταξύ των δορυφόρων, των ΣμηΕΑ (Συστήματα μη Επανδρωμένων Αεροσκαφών) και των επίγειων αισθητήρων στην αξιολόγηση της απόδοσης της καλλιέργειας. Με την εκτεταμένη σύγκριση των δορυφόρων, ΣμηΕΑ και επίγειων αισθητήρων, δόθηκε ιδιαίτερη σημασία στα πλεονεκτήματα και περιορισμούς τους στο πλαίσιο της Γεωργίας Ακριβείας (ΓΑ).
Κατά τη δεύτερη χρονική περίοδο, εκτός από τα συγκεκριμένα αγροτεμάχια που υποβλήθηκαν σε λεπτομερή έρευνα με χρήση δορυφορικών, ΣμηΕΑ και επίγειων αισθητήρων, μια διευρυμένη μελέτη πραγματοποιήθηκε που περιλάμβανε 108 αγροτεμάχια σε περιφερειακή κλίμακα, ενσωματώνοντας την ανάλυση δορυφορικών δεδομένων. Αυτή η φάση είχε ως στόχο να αξιολογήσει όχι μόνο τον NDVI, αλλά και τέσσερις επιπλέον δείκτες βλάστησης στην πρόβλεψη της απόδοσης της καλλιέργειας. Χρησιμοποιήθηκαν χρονοσειρές δεδομένων που περιλάμβαναν πέντε δείκτες βλάστησης σε περιφερειακή κλίμακα για να εξετάσουν τη σχέση μεταξύ αυτών των δεικτών και των κρίσιμων φαινολογικών σταδίων της καλλιέργειας. Στο πλαίσιο αυτό πραγματοποιήθηκε η χρήση τεχνικών αυτοματοποιημένης μηχανικής μάθησης (AutoML) σε συνδυασμό με δεδομένα δεικτών βλάστησης που ανακτήθηκαν από δορυφορικά σύνολα δεδομένων για τη συσχέτιση τους με την απόδοση. Τα μετασχηματισμένα δεδομένα στη συνέχεια χρησιμοποιήθηκαν για την εκπαίδευση και τη δοκιμή αλγορίθμων στατιστικής και μηχανικής μάθησης, συμπεριλαμβανομένων μοντέλων γραμμικής και μη γραμμικής παλινδρόμησης και μεθόδων συνόλου που βασίζονται σε δέντρα αποφάσεων Στην ανάλυση χρησιμοποιήθηκαν η μέθοδος ελάχιστου τετραγώνου (OLS), μοντέλα παλινδρόμησης Theil-Sen και Huber και μέθοδοι που βασίζονται σε δέντρα. Συμπεριλήφθηκαν επίσης μηχανές διανυσμάτων υποστήριξης (SVM) και αυτόματος προσδιορισμός συνάφειας (ARD). Αυτός οι ευρύτερες δραστηριότητες στόχευαν στην εμβάθυνση της κατανόησης στην εκτίμηση της απόδοσης των καλλιεργειών, λαμβάνοντας υπόψη τα ευρήματα από την αρχική συστηματική ανασκόπηση.
Κατά το τρίτο έτος, υιοθετήθηκε μια πιο περίπλοκη προσέγγιση, με επίκεντρο την αξιολόγηση των φασματικών καναλιών από τον δορυφόρο Sentinel 2. Η ατομική απόδοση κάθε καναλιού στην πρόβλεψη της απόδοσης των καλλιεργειών αξιολογήθηκε, επιτρέποντας μια ολοκληρωμένη αξιολόγηση της μοναδικής συνεισφοράς τους στη συνολική ακρίβεια εκτίμησης της απόδοσης. Αυτή η ανάλυση παρείχε βαθύτερες γνώσεις σχετικά με τη σημασία και τον αντίκτυπο της κάθε φασματικής ζώνης στη βελτίωση της ακρίβειας των προβλέψεων απόδοσης των καλλιεργειών. Η αξιολόγηση την απόδοση τόσο των στατιστικών όσο και των μοντέλων μηχανικής μάθησης συνείσφερε στην απόκτηση βαθύτερης κατανόησης σχετικά με τα πιο αποτελεσματικά στάδια ανάπτυξης και τους δείκτες βλάστησης για την ακριβή πρόβλεψη της παραγωγής.
Τα ευρήματα αυτής της μελέτης έδειξαν ουσιαστική ομοιότητα μεταξύ των δεδομένων ΣμηΕΑ και δορυφόρου, ειδικά στα μεταγενέστερα στάδια του φαινολογικού κύκλου της καλλιέργειας, υπονοώντας μια αυξημένη συμφωνία καθώς η καλλιέργεια ωρίμαζε. Η μελέτη εντόπισε μια μέτρια συσχέτιση μεταξύ των δεδομένων εγγύς αισθητήρα και των συνόλων δεδομένων ΣμηΕΑ /δορυφόρου, με αποκλίσεις που αποδίδονται σε διακυμάνσεις στα μήκη κύματος μέτρησης κάθε πλατφόρμας. Όσον αφορά στη σχέση της δυναμικής των δεικτών βλάστησης σε σχέση με τον φαινολογικό κύκλο της καλλιέργειας, οι χαμηλότερες μέσες τιμές για όλους τους δείκτες βλάστησης παρατηρήθηκαν λίγο μετά τη μεταφύτευση, οι οποίες οφείλονται στην περιορισμένη κάλυψη βλάστησης και το εκτεθειμένο έδαφος μεταξύ των σειρών. Ιδιαίτερα καθώς προχωρούσε η καλλιεργητική περίοδος, το ποσοστό φυτικής κάλυψης αυξήθηκε σταδιακά, ιδιαίτερα κατά τη μέση της περιόδου, όταν τα φυτά τομάτας έφτασαν στο μέγιστο της βλάστησης τους λίγο πριν ανακατανείμουν τα σάκχαρα στους καρπούς τους.
Όσον αφορά στην πρόβλεψη απόδοσης, ο επίγειος αισθητήρας έδειξε υψηλότερη επεξηγητική ισχύ κατά την αρχική φάση ανάπτυξης φυλλώματος, ενώ τα δεδομένα από το ΣμηΕΑ και τον δορυφόρο βελτίωσαν την απόδοσή τους καθώς διευρύνθηκε η κάλυψη του φυλλώματος. Η δορυφορική πλατφόρμα επέδειξε ανώτερη απόδοση κατά το κρίσιμο στάδιο της ανθοφορίας, τονίζοντας την αποτελεσματικότητά της στην αποσαφήνιση της μεταβλητότητας της απόδοσης. Η μελέτη χρησιμοποίησε βασικές στατιστικές μεθόδους, ειδικότερα το συντελεστή συσχέτισης Pearson, επισημαίνοντας την βέλτιστη απόδοση των δεικτών βλάστησης σε συγκεκριμένα στάδια ανάπτυξης. Επιπλέον, ενσωματώθηκαν αλγόριθμοι μηχανικής μάθησης για τη βελτίωση της ακρίβειας πρόβλεψης απόδοσης, οι οποίοι αξιολογήθηκαν αυστηρά μέσω ανάλυσης παλινδρόμησης και μιας διαδικασίας διασταυρούμενης επικύρωσης. Η έρευνα ανέδειξε τους δείκτες RVI και SAVI ως τους πιο αποτελεσματικούς για τις προβλέψεις της απόδοσης, επιτυγχάνοντας υψηλές τιμές R² και χαμηλά RMSEs, ιδιαίτερα 90 ημέρες μετά τη μεταφύτευση. Οι συνδυασμοί μοντέλων ARD και SVR πέτυχαν σταθερή ικανοποιητική απόδοση, υπογραμμίζοντας την αποτελεσματικότητα του συνδυασμού διαφορετικών μοντέλων. Η χρήση των φασματικών καναλιών 8, 4 και 12 παρείχε αξιόλογα αποτελέσματα. Οι φασματικές ζώνες Red Edge/NIR εμφάνισαν αξιοσημείωτη απόδοση, ειδικά εντός του παραθύρου 80 έως 90 ημερών μετά τη μεταφύτευση, παρουσιάζοντας την ισχυρότερη συσχέτιση με την απόδοση.
Συνολικά, τα ευρήματα υποδηλώνουν ότι οι αισθητήρες ΣμηΕΑ και οι δορυφορικοί αισθητήρες επιδεικνύουν μεγαλύτερη ακρίβεια στην πρόβλεψη της απόδοσης των καλλιεργειών προς το τέλος της σεζόν και προσφέρουν αυξημένη ακρίβεια κατά τα τελευταία στάδια ανάπτυξης. Αντίθετα, οι επίγειοι αισθητήρες παρουσιάζουν συσχετίσεις σε προηγούμενα στάδια ανάπτυξης της καλλιέργειας. Ο συνδυασμός δεδομένων από πολλούς αισθητήρες και στάδια ανάπτυξης μπορεί να βελτιώσει την ακρίβεια πρόβλεψης. Η χρήση δεδομένων δεικτών βλάστησης και φασματικών καναλιών σε συνδυασμό με τεχνικές μηχανικής μάθησης συνιστά μια πιο αποτελεσματική και οικονομικά αποδοτική μέθοδο για την πρόβλεψη της παραγωγής βιομηχανικής ντομάτας.