Νέο υπολογιστικό μοντέλο αναγνώρισης

Κυκλοφορήσαμε ένα καινούργιο μοντέλο αυτόματης αναγνώρισης ειδών για το iNaturalist. Εδώ είναι το πρώτο μας μοντέλο από τον Μάρτιο 2020 . Ορίστε τι πρέπει να γνωρίζετε.

Είναι πολύ μεγαλύτερο

Ο αριθμός των taxa που περιλαμβάνεται στο μοντέλο αυξήθηκε από 25.000 σε 38.000. Αυτή είναι μια αύξηση της τάξης των 13.000 taxa, συγκριτικά με το τελευταίο μοντέλο, το οποίο, για να κάνετε την αναλογία, είναι περισσότερο από τον συνολικό αριθμό πουλιών παγκοσμίως. Ο αριθμός των φωτογραφιών εξάσκησης αυξήθηκε από 12 εκατομμύρια σε 21 εκατομμύρια.

Αυξήσαμε τον χρόνο εξάσκησης

Αυτό μπορεί να ακουστεί ύποπτο, συνδυαστικά με την μεγάλη καθυστέρηση, αλλά αυτές οι μεγάλες καθυστερήσεις συνέβησαν λόγω της πανδημίας, η οποία ‘’έβαλε στον πάγο’’ όλα μας τα εν ενεργεία σχέδια (δείτε τα μελλοντικά μας σχέδια παρακάτω). Έχουμε σημαντικά μειώσει τον χρόνο εξάσκησης του μοντέλου με την νέα μας προσέγγιση.

Η προηγούμενη μας δουλειά εκπαίδευσης πήρε 4.5 μήνες για να εκπαιδεύσουμε 12 εκατομμύρια φωτογραφίες. Η καλύτερη μας πρόβλεψη ήταν πως με την νέα μας προσέγγιση, και τον αυξημένο αριθμό δεδομένων, θα χρειαζόντουσαν περίπου 7 μήνες. Αντ’ αυτού χρειάστηκαν 2.5 μήνες ( από τον Ιανουάριο μέχρι τα μέσα Μαρτίου). Είμαστε πολύ ενθουσιασμένοι για την νέα μας προσέγγιση, η οποία μας δίνει την δυνατότητα να κυκλοφορήσουμε δύο μοντέλα μέσα στον επόμενο χρόνο.

Ακρίβεια

Η ακρίβεια εκτός της Βόρειας Αμερικής έχει αυξηθεί σημαντικά σε αυτό το μοντέλο. Υποπτευόμαστε ότι αυτό οφείλεται κυρίως στον σχεδόν διπλάσιο όγκο δεδομένων που έχει το νέο μοντέλο, σε συνδυασμό με την παγκόσμια αύξηση των χρηστών της κοινότητας του iNaturalist. Συνεχίζουμε να δουλεύουμε προς την ανάπτυξη ενός καλύτερου λογισμικού ανίχνευσης των αλλαγών στην ακρίβεια του μοντέλου, ειδικά λαμβάνοντας υπ’ όψιν ανταλλαγές μεταξύ παγκόσμιας και τοπικής ακρίβειας και ακρίβειας για κάποια συγκεκριμένη ομάδα taxa.

Οι τελευταίες αλλαγές αφαίρεσαν τα μη κοντινά taxa από τις προτάσεις έχουν βοηθήσει στην παγκόσμια και τοπική αντιστάθμιση ακρίβειας, αλλά υπάρχει πολλή δουλειά ακόμα να γίνει για να καλυτερεύσει ο τρόπος με τον οποίο η αυτόματη αναγνώριση δέχεται την γεωγραφική πληροφορία.

Σελίδα αναγνώρισης taxa

Έχουμε επίσης κυκλοφορήσει μια νέα ιδιότητα για τις σελίδες ταξών στο διαδίκτυο που επιτρέπει να δει ο χρήστης τα taxa που υπάρχουν στο μοντέλο. Αυτή η επιλογή υπάρχει μόνο σε σελίδες ειδών, όχι γενών, οικογενειών, κτλ.

Μελλοντική δουλειά

Το νέο αυτό μοντέλο βρίσκεται στην σελίδα του iNaturalist και στην εφαρμογή για χρήση. Το Seek by iNaturalist , απαιτεί ένα ακόμη βήμα για να γίνει το μοντέλο αρκετά συμπιεσμένο για να τρέξει στην εφαρμογή. Μείνετε συντονισμένοι για την ενημέρωση του μοντέλου Seek σύντομα.

Η πανδημία εμπόδισε το προσωπικό του iNaturalist από την πρόσβαση στα γραφεία μας στην Ακαδημία Επιστημών της Καλιφόρνιας για πάνω από ένα χρόνο. Δυστυχώς, είχαμε παραγγείλει ένα νέο, δυνατότερο μηχάνημα για δοκιμή των μοντέλων ακριβώς πριν συμβεί όλο αυτό. Ο στόχος είναι να πιλοτάρουμε το νέο μας λογισμικό με αυτό τον νέο εξοπλισμό.

Αν και χάσαμε χρόνο εξ αιτίας της αβεβαιότητας, ο @alexshepard κατέληξε να αναπτύξει και να δοκιμάσει την νέα προσέγγιση του λογισμικού σε μια πρόχειρη κατασκευή στο σαλόνι του και τελικά, εκπαίδευσε το μοντέλο που εμείς κυκλοφορούμε τώρα. Δοκιμάζοντας αυτό το νέο λογισμικό δούλεψε καλά και ανυπομονούμε να φτάσουμε στο επόμενο μοντέλο εκπαίδευσης και να το δοκιμάσουμε με την νέα μας μηχανή, η οποία ξεκινάει να εγκαθίσταται στην Ακαδημία Επιστημών της Καλιφόρνια. Αυτός ο νέος εξοπλισμός μαζί με το νέο λογισμικό θα βοηθήσει στην βελτίωση του χρόνου εξάσκησης.

Θέλουμε να πραγματοποιήσουμε την δοκιμή του νέου μας λογισμικού μέσα στον επόμενο μήνα. Ένα πρόβλημα που ξέρουμε ότι θα αντιμετωπίζουμε συνέχεια είναι το να βρίσκουμε τρόπους να εκπαιδεύουμε σωστά με τα ολοένα αυξανόμενα δεδομένα του iNaturalist. Εδώ είναι τρεις τρόποι με τους οποίους μπορείτε να μας βοηθήσετε:
Μοιραστείτε τις γνώσεις σας σε machine learning: Η αυτόματη αναγνώριση του iNaturalist δεν θα ήταν δυνατή χωρίς την γνώση σε machine learning πολλών συναδέλφων. Εάν έχετε γνώσεις machine learning, ορίστε δύο τρόποι για να βοηθήσετε:
Λάβετε μέρος στις ετήσιες προκλήσεις του iNaturalist: Οι συνεργάτες μας Grant Van Horn και Oisin Mac Aodha συνεχίζουν να διοργανώνουν προκλήσεις machine learning με δεδομένα του iNaturalist σαν κομμάτι του ετήσιου συνεδρίου Computer Vision and Pattern Recognition. Με την συμμετοχή σας μπορείτε να μας βοηθήσετε όλους να μάθουμε νέες τεχνικές για την βελτίωση των μοντέλων αυτών.
Ξεκινήστε τώρα να χτίζετε το δικό σας μοντέλο με τα δεδομένα του iNaturalist: Εάν δεν μπορείτε να περιμένετε για το επόμενο συνέδριο CVPR, χάρην στο Amazon Open Data Program , μπορείτε να ξεκινήσετε να κατεβάζετε δεδομένα του iNaturalist για να εκπαιδεύσετε το δικό σας μοντέλο. Παρακαλούμε μοιραστείτε μαζί μας το τι θα μάθετε με την συνεισφορά σας στο iNaturalist στο Github.
Κάντε μια δωρεά στο iNaturalist: για εμάς τους υπόλοιπους μπορείτε να βοηθήσετε με την δωρεά σας! Οι δωρεές σας βοηθάνε να αντισταθμίσουμε το σημαντικό κόστος σε υποδομές και προσωπικό που σχετίζετε με την εκπαίδευση, εκτίμηση και έκδοση ενημερώσεων για τα λογισμικά μας. Ευχαριστούμε για την υποστήριξη σας!

Εδώ βρίσκεται ένα σχετικό φόρουμ με περισσότερες τεχνικές λεπτομέρειες σχετικά με την νέα μας προσέγγιση του λογισμικού και του εξοπλισμού, εάν ενδιαφέρεστε!

Αναρτήθηκε από dkats dkats, Ιούλιος 14, 2021 1001 ΠΜ

Σχόλια

Δεν υπάρχουν ακόμα σχόλια

Προσθήκη σχόλιου

Συνδεθείτε ή Εγγραφή για να προσθέσετε σχόλια