HEAL DSpace

Investigating the application of precision agriculture and big data analytics in vineyards

DSpace/Manakin Repository

Show simple item record

dc.contributor.advisor Spyros, Fountas en
dc.contributor.advisor Σπύρος, Φουντάς el
dc.contributor.author Kasimati, Aikaterini I. en
dc.contributor.author Κασιμάτη, Αικατερίνη Ι. el
dc.date.issued 2024-04-17
dc.identifier.uri http://hdl.handle.net/10329/8187
dc.description.abstract The use of vegetation indices, specifically the normalized difference vegetation index (NDVI), is common in the production of wine grapes as a way to differentiate management units (MU) and explain variability in quantity and quality. This study compares NDVI data from four different sources – two terrestrial crop reflectance sensors and UAV and Sentinel-2 imagery – over two seasons to determine the similarity of the data and its ability to explain grape yield and quality. CropCircle, SpectroSense+GPS, Parrot Sequoia+ multispectral camera equipped UAV, and Sentinel-2 imagery were used to collect high-resolution multispectral multi-temporal data over two seasons (2019 and 2020). The study aims to investigate the differences between vegetation index (VI) maps derived from various sensing systems in a production context and to determine the extent to which NDVI values obtained from these different systems are correlated and how well they can explain variations in yield and quality. Data pre-processing techniques, including data quality assessment, data interpolation onto a grid (20 m x 10 m), and data normalization, were applied to the data. Methods, such as exploratory correlation analysis, principal component analysis, and analysis of variance and the creation of management unit maps were used to compare the data and determine how similar the sources were and identify relationships between NDVI values and grape yield and quality. This study also explores the use of machine learning techniques and NDVI data collected at different growth stages to predict wine grape quality characteristics non-destructively. The transformed data was then used to train and test statistical and machine learning algorithms, including linear and nonlinear regression models and ensemble methods based on decision trees. Finally, this study investigates the use of automated machine learning (AutoML) techniques in combination with NDVI data to predict grape quality attributes in vineyards. Ordinary Least Square (OLS), Theil-Sen and Huber regression models, and tree-based methods were used in the analysis. Support Vector Machines (SVMs) and Automatic Relevance Determination (ARD) were also included. Results show strong similarities between NDVI values obtained from similar sensors, but differences between proximal and remote sensing observations. NDVI data had high correlations with grape yield and total soluble solids, but no relationship was found with must titratable acidity or pH. Proximal sensors were found to better explain variability in yield and quality in the early season and later growth stages, while satellite data was found to be less consistent due to its coarse spatial resolution. NDVI values obtained from different sensors, especially satellite platforms, generated differing information for decision making and were not equally useful when converted to production decisions. Proximal sensors were more accurate in predicting wine grape quality parameters in the early season, while remote sensors were more accurate during later growth stages. The UAV and Spectrosense+GPS data were found to be particularly accurate in predicting sugar content, especially during mid-late season with full canopy growth. Regression models using AutoML (R2 = 0.65) provided slightly improved results compared to those using manually fine-tuned machine learning (R2 = 0.61). When combining data from multiple sensors and growth stages within a single year, the coefficient of determination (R2) increased to an average of 0.66 for the best-fitting regressions. When considering combinations of sensors and growth stages across both cropping seasons, UAV and Spectrosense+ GPS, as well as Véraison and Flowering, each had the highest average R2 values. These results suggest that AutoML has potential for long-term performance and may be a useful tool in improving the efficiency of crop quality prediction. Overall, the results suggest that proximal sensors are more accurate in predicting wine grape quality characteristics in the early season, while remote sensors are more accurate during later growth stages. Combining data from multiple sensors and growth stages can improve the accuracy of predictions. The use of NDVI data in combination with machine learning techniques may provide a more efficient and cost-effective method for predicting wine grape quality characteristics. en
dc.description.abstract Η χρήση δεικτών βλάστησης, και συγκεκριμένα ο δείκτης βλάστησης κανονικοποιημένης διαφοράς (NDVI), είναι μια μέθοδος διαφοροποίησης των μονάδων διαχείρισης (MU) και ερμηνείας της μεταβλητότητας στη τελική παραγωγή και τα ποιοτικά χαρακτηριστικά των οινοποιήσιμων σταφυλιών. Η παρούσα μελέτη συγκρίνει δεδομένα NDVI από τέσσερις διαφορετικές πηγές - σημειακά δεδομένα ανάκλασης από δύο επίγειους αισθητήρες ανάκλασης φυλλώματος και εικόνες από UAV και τον δορυφόρο Sentinel-2 - για δύο καλλιεργητικές περιόδους (2019 και 2020) με σκοπό να προσδιορίσει την ομοιότητα των δεδομένων και την ικανότητά τους να ερμηνεύουν την απόδοση και την ποιότητα των σταφυλιών. Για τη συλλογή πολυφασματικών πολυχρονικών δεδομένων υψηλής ανάλυσης χρησιμοποιήθηκαν οι αισθητήρες CropCircle, SpectroSense+GPS, ένα UAV εξοπλισμένo με πολυφασματική κάμερα Parrot Sequoia+ και δορυφορικές εικόνες Sentinel-2. Η μελέτη στοχεύει να διερευνήσει τις διαφορές μεταξύ των χαρτών δείκτη βλάστησης (VI) που προέρχονται από διάφορα συστήματα ανίχνευσης στο πλαίσιο παραγωγής και να καθορίσει τον βαθμό στον οποίο οι τιμές NDVI που συλλέγονται από αυτά συσχετίζονται καθώς και πόσο καλά μπορούν να εξηγήσουν τις διακυμάνσεις στην απόδοση και την ποιότητα. Στα δεδομένα εφαρμόστηκαν τεχνικές προεπεξεργασίας, συμπεριλαμβανομένης της αξιολόγησης ποιότητας δεδομένων, της παρεμβολής δεδομένων σε ένα πλέγμα (20 m x 10 m), και της κανονικοποίησης. Μέθοδοι όπως η διερευνητική ανάλυση συσχέτισης, η ανάλυση κύριας συνιστώσας, η ανάλυση διακύμανσης και η δημιουργία χαρτών με μονάδες διαχείρισης χρησιμοποιήθηκαν για τη σύγκριση των δεδομένων και τον προσδιορισμό της ομοιότητας των πηγών όπως επίσης και για τον προσδιορισμό των σχέσεων μεταξύ των τιμών NDVI και της απόδοσης και ποιότητας των σταφυλιών. Αυτή η μελέτη διερευνά επίσης τη χρήση τεχνικών μηχανικής μάθησης για δεδομένα NDVI που συλλέχθηκαν σε διαφορετικά στάδια ανάπτυξης για την πρόβλεψη των ποιοτικών χαρακτηριστικών των σταφυλιών με μη καταστρεπτικές μέθοδος. Τα μετασχηματισμένα δεδομένα στη συνέχεια χρησιμοποιήθηκαν για την εκπαίδευση και τη δοκιμή αλγορίθμων στατιστικής και μηχανικής μάθησης, συμπεριλαμβανομένων μοντέλων γραμμικής και μη γραμμικής παλινδρόμησης και μεθόδων συνόλου που βασίζονται σε δέντρα αποφάσεων. Τέλος, αυτή η μελέτη διερευνά τη χρήση τεχνικών αυτοματοποιημένης μηχανικής μάθησης (AutoML) σε συνδυασμό με δεδομένα NDVI για την πρόβλεψη των ποιοτικών χαρακτηριστικών σταφυλιών στους αμπελώνες. Στην ανάλυση χρησιμοποιήθηκαν η μέθοδος ελάχιστου τετραγώνου (OLS), μοντέλα παλινδρόμησης Theil-Sen και Huber και μέθοδοι που βασίζονται σε δέντρα. Συμπεριλήφθηκαν επίσης μηχανές διανυσμάτων υποστήριξης (SVM) και αυτόματος προσδιορισμός συνάφειας (ARD). Τα αποτελέσματα δείχνουν ισχυρές ομοιότητες μεταξύ των τιμών NDVI που λαμβάνονται από παρόμοιους αισθητήρες, αλλά διαφορές μεταξύ παρατηρήσεων που συλλέχθηκαν από διαφορετικά επίπεδα (επίγεια και τηλεσκοπικά). Τα δεδομένα NDVI είχαν υψηλές συσχετίσεις με την απόδοση σταφυλιού και τα ολικά διαλυτά στερεά, αλλά δεν παρατηρήθηκε συσχέτιση με την τιτλοποιήσιμη οξύτητα ή το pH του γλεύκους. Επιπλέον διαπιστώθηκε ότι οι επίγειοι αισθητήρες εξηγούν καλύτερα τη μεταβλητότητα της απόδοσης και της ποιότητας στα πρώτα στάδια της καλλιεργητικής περιόδου και στα μεταγενέστερα στάδια ανάπτυξης, ενώ τα δορυφορικά δεδομένα ήταν λιγότερο αποτελεσματικά λόγω της αδρής χωρικής τους ανάλυσης. Οι τιμές του NDVI που ελήφθησαν από διαφορετικούς αισθητήρες, ειδικά από δορυφορικές πλατφόρμες, παρήγαγαν διαφορετικές πληροφορίες για τη λήψη αποφάσεων και δεν ήταν εξίσου χρήσιμες όταν μετατράπηκαν σε αποφάσεις παραγωγής. Οι επίγειοι αισθητήρες ήταν πιο ακριβείς στην πρόβλεψη των παραμέτρων ποιότητας των σταφυλιών στην αρχή της σεζόν, ενώ οι τηλεσκοπικοί αισθητήρες ήταν πιο ακριβείς κατά τα μεταγενέστερα στάδια ανάπτυξης. Τα δεδομένα από UAV και Spectrosense+GPS βρέθηκαν να είναι ιδιαίτερα ακριβή στην πρόβλεψη της περιεκτικότητας σε σάκχαρα, ειδικά στα μέσα και προς τα τέλη της καλλιεργητικής περιόδου με πλήρη ανάπτυξη θόλου. Τα μοντέλα παλινδρόμησης που χρησιμοποιούν AutoML παρείχαν ελαφρώς βελτιωμένα αποτελέσματα (R2 = 0,65) σε σύγκριση με εκείνα που χρησιμοποιούν μηχανική εκμάθηση με χειροκίνητη βελτίωση (R2 = 0,61). Όταν συνδυάστηκαν δεδομένα από πολλαπλούς αισθητήρες και στάδια ανάπτυξης μέσα σε ένα μόνο έτος, ο συντελεστής προσδιορισμού (R2) αυξήθηκε στο 0,66 για τις παλινδρομήσεις που είχαν υψηλότερη απόδοση. Όταν συνδυάστηκαν οι αισθητήρες και στάδια ανάπτυξης και στις δύο περιόδους καλλιέργειας, το UAV και το Spectrosense+ GPS, καθώς και τα στάδια ανάπτυξης του περκασμού και της ανθοφορίας, το καθένα είχε τις υψηλότερες μέσες τιμές R2. Αυτά τα αποτελέσματα υποδηλώνουν ότι η AutoML έχει δυνατότητες για μακροπρόθεσμη απόδοση και μπορεί να είναι ένα χρήσιμο εργαλείο για τη βελτίωση της αποτελεσματικότητας πρόβλεψης της ποιότητας των καλλιεργειών. Συνολικά, τα αποτελέσματα υποδεικνύουν ότι οι επίγειοι αισθητήρες είναι πιο ακριβείς στην πρόβλεψη των ποιοτικών χαρακτηριστικών των σταφυλιών στην αρχή της σεζόν, ενώ οι απομακρυσμένοι αισθητήρες είναι πιο ακριβείς κατά τα μεταγενέστερα στάδια ανάπτυξης. Ο συνδυασμός δεδομένων από πολλούς αισθητήρες και σταδίων ανάπτυξης μπορεί να βελτιώσει την ακρίβεια των προβλέψεων. Η χρήση δεδομένων NDVI σε συνδυασμό με τεχνικές μηχανικής μάθησης μπορεί να αποτελέσει μια πιο αποτελεσματική και οικονομικά αποδοτική μέθοδο για την πρόβλεψη των ποιοτικών χαρακτηριστικών των αμπελιών. el
dc.language.iso en en
dc.subject Precision viticulture en
dc.subject Remote sensing en
dc.subject Fuzzy clustering en
dc.subject Management units en
dc.subject NDVI Correlation en
dc.subject Linear regression en
dc.subject Ensemble methods en
dc.subject AutoML en
dc.subject Bayesian optimisation en
dc.subject Quality prediction en
dc.subject Αμπελουργία ακριβείας el
dc.subject Τηλεπισκόπηση el
dc.subject Ασαφής ομαδοποίηση el
dc.subject Ζώνες διαχείρισης el
dc.subject Συσχέτιση el
dc.subject Γραμμική παλινδρόμηση el
dc.subject Ensemble τεχνικές el
dc.subject Μπεϋζιανή βελτιστοποίηση el
dc.subject Πρόβλεψη ποιότητας παραγωγής el
dc.title Investigating the application of precision agriculture and big data analytics in vineyards en
dc.title.alternative Διερεύνηση της εφαρμογής γεωργίας ακριβείας και της ανάλυσης μεγάλων δεδομένων σε αμπελώνες el
dc.type Διδακτορική εργασία el
dc.contributor.department ΓΠΑ Τμήμα Αξιοποίησης Φυσικών Πόρων και Γεωργικής Μηχανικής el
dc.embargo.liftdate 2024-12-27
dc.embargo.terms 2024-12-27


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account