Alibaba: Λανσάρει το AI "Qwen 2.5-Max" - Επιδεικνύει υπεροχή σε επιδόσεις

Η Alibaba, εταιρεία με έδρα την Κίνα, παρουσίασε την Τετάρτη μια νέα έκδοση του μοντέλου Τεχνητής Νοημοσύνης της, το Qwen 2.5, την οποία προβάλλει ως πιο εξελιγμένη και αποδοτική σε σχέση με το διάσημο DeepSeek-V3, το οποίο έχει προκαλέσει μεγάλη αίσθηση στον τομέα της Τεχνητής Νοημοσύνης.
Η ασυνήθιστη χρονική στιγμή κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι βρίσκονται σε αργία και περνούν χρόνο με τις οικογένειές τους, υπογραμμίζει την πίεση που ασκεί η ραγδαία άνοδος της κινεζικής εταιρείας Τεχνητής Νοημοσύνης DeepSeek τις τελευταίες τρεις εβδομάδες. Η κίνηση αυτή δεν επηρεάζει μόνο τους διεθνείς ανταγωνιστές, αλλά και τον εγχώριο ανταγωνισμό στην Κίνα.
Όπως αναφέρει η μονάδα cloud της Alibaba σε ανακοίνωσή της και η οποία δημοσιεύθηκε στον επίσημο λογαριασμό της στο WeChat, η εταιρεία αναφέρεται στα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα “το Qwen 2.5-Max ξεπερνάει … σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B”.
Η παρουσίαση του βοηθού ΑΙ της DeepSeek, βασισμένου στο μοντέλο DeepSeek-V3, στις 10 Ιανουαρίου, καθώς και η παρουσίαση του μοντέλου R1 στις 20 Ιανουαρίου, προκάλεσαν έκπληξη στη Σίλικον Βάλεϊ και οδήγησαν σε πτώση των μετοχών των τεχνολογικών εταιρειών. Τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τις τεράστιες δαπάνες των κορυφαίων εταιρειών τεχνητής νοημοσύνης στις ΗΠΑ.
Παράλληλα, η επιτυχία της DeepSeek ώθησε και τους εγχώριους ανταγωνιστές να εξελίξουν τα δικά τους μοντέλα τεχνητής νοημοσύνης.
Μετά από δύο ημέρες από την παρουσίαση του DeepSeek-R1, η ByteDance, ιδιοκτήτρια του TikTok, ανακοίνωσε μια επικαιροποιημένη έκδοση του μοντέλου τεχνητής νοημοσύνης της, υποστηρίζοντας ότι προσφέρει καλύτερες επιδόσεις από το μοντέλο o1 της OpenAI στο AIME, ένα τεστ που μετρά την ικανότητα κατανόησης και αντίδρασης σε περίπλοκες οδηγίες.
Αυτό αντικατοπτρίζει τον ισχυρισμό της DeepSeek ότι το μοντέλο R1 υπερέχει σε πολλά κριτήρια απόδοσης σε σχέση με το o1 της OpenAI.