אפליקציית deepseek המותקנת באייפון

הכירו את DeepSeek, הבינה המלאכותית הסינית שמאיימת על ChatGPT

אוואטר של ויקטור פאצ'קו
הבינו את המקרה של הסטארט-אפ הסיני שעוקר את ענקיות הבינה המלאכותית האמריקאיות וגרם להפסדים של יותר מטריליון דולר בנאסד"ק

בסוף השבוע האחרון, בינה מלאכותית בשם DeepSeek, שפותחה בסין, מעוררת סערה בעולם הטכנולוגיה וגורמת לשווי המניות של ענקיות אמריקאיות כמו NVIDIA, גוגל, מטה ומיקרוסופט לצנוח ביותר מ-1 טריליון דולר. הבן איך זה עובד ואיך זה יכול להשפיע על עולם הטכנולוגיה, אבל ספציפית על ChatGPT של OpenAI.

מה זה DeepSeek

ליאנג וונפנג, מייסד deepseek
Liang Wenfeng, מייסד DeepSeek (צילום: Reproduction/Mashable)

DeepSeek היא חברת בינה מלאכותית סינית, שנוצרה בשנת 2023 על ידי ליאנג וונפנג, יזם סיני ומייסד שותף של קרן גידור כמותית High-flyer. קרן זו, המפורסמת בשימוש בטכניקות למידת מכונה בהשקעות במניות, היא גם המממנת הנוכחית של מחקר הבינה המלאכותית של החברה.

מאז 2023, החברה מושכת תשומת לב עולמית בשל ההתפתחות המהירה של מודלים לשפות או LLMs שלה.

פיתוח בעלות נמוכה

הכירו את Deepseek, הבינה המלאכותית הסינית שמאיימת על צ'אט. הבינו את המקרה של הסטארט-אפ הסיני שעוקר את ענקיות הבינה המלאכותית האמריקאיות וגרם להפסדים של יותר מטריליון דולר בנאסד"ק
DeepSeek טוענת שהשתמשה בפחות גרפי GPU מאשר OpenAI, ומספקת את אותם ביצועים (צילום: Reproduction/NVIDIA)

היתרון העיקרי של דגמים הוא עלות הפיתוח שלהם. במאמר שפורסם לאחרונה, החברה הסבירה כי מודל השפה שלה DeepSeek-V3 בשימוש 2 כרטיסי NVIDIA H800, שכבר מבוגרים יחסית, לאימון ב-a עלות כוללת של 5,5 מיליון דולר

לשם השוואה, זהו רק חלק קטן מהעלות של הכשרת דגם כמו ה-Llama 3.3 של Meta, שהשנה לבדה צפוי להוציא יותר מ- 65% מיליארד דולר בשיפור שלו. בהשוואה זו, העלויות של DeekpSeek בסופו של דבר נמוכות אפילו מהשכר השנתי של חלק מהמנהלים בחברה של Meta. לדברי אנליסטים, הפחתת העלויות מגיעה למרשימה 95%.

הישג זה שם קץ לפרדיגמה לפיה יהיה צורך בהשקעות גבוהות בתשתית מרכזי נתונים וחשמל כדי להכשיר AI, מה שהופך את DeepSeek ל-AI שהוא לא רק זול יותר, אלא גם בר-קיימא יותר מבחינה אקולוגית. 

בתיאוריה, במקום להשתמש במרכזי נתונים מיוחדים עם GPUs יקרים מאוד המיועדים לדרישות AI גבוהות, ניתן אפילו לאמן דגמי DeepSeek במחשבים ביתיים, עם GPUs מסורתיים, מה שגורם הן לתדהמה והן לפחד בחברות כמו NVIDIA, שכל כך מינפה על ידי ממהרים לאחרונה לבנות מרכזי נתונים על ידי חברות המחפשות נתח בשוק זה.

אדם מסתכל בטאבלט
DeepSeek Panic Day היה בסימן הפסדים במניות של כמה חברות טכנולוגיה (צילום: Reproduction/Forbes)

מסיבה זו, במה שנודע כ- "DeepSeek Panic Day" ou "יום פאניקה של DeepSeek", בתרגום חופשי, ה-27 בינואר סומן בירידות של מיליארדי דולרים במניות בנאסד"ק, הבורסה לניירות ערך של חברות טכנולוגיה אמריקאית, שהגיעו ל-3,5% מסך המסחר. למתחרה של ChatGPT יש הכל כדי להצליח.

DeepSeek-V3 ו-DeepSeek-R1

לוגו deepseek-v3
DeepSeek-V3 היה הבסיס למודל השפה של האפליקציה (צילום: Disclosure)

גם הדגמים של החברה הם דוגמה ליעילות. THE DeepSeek-V3, למשל, מתגאה בביצועים מרשימים על פני מספר אמות מידה תוך שהוא דורש פחות משאבים באופן משמעותי מאשר מתחרים כמו Llama 3.3 של Meta. ואת DeepSeek-R1, שהושק בינואר 2025, מתמקד במשימות חשיבה ומאתגר את מודל ה-o1 של OpenAI עם התכונות המתקדמות שלו.

למעשה, שתי האפשרויות של מודל הבינה המלאכותית הסינית לומדות על ידי אינטראקציה עם הסביבה שלהם וקבלת משוב על מעשיהם, בדומה לאופן שבו בני אדם לומדים באמצעות ניסיון. זה מאפשר להם להתפתח כישורי חשיבה מתוחכמים יותר ולהסתגל למצבים חדשים בצורה יעילה יותר. גישה זו גם זולה יותר מ"למידה בפיקוח אנושי" בה משתמשים המתחרים.

יתרון נוסף של AI סינית זו הוא חיסכון במשאבים. במקום להשתמש בכל הפרמטרים של המודל כדי לענות על שאילתה, המודלים של DeepSeek בוחרים רק כמה "פרמטרים ספציפיים" או "מומחים" לנושא. הפעלה סלקטיבית זו מפחיתה משמעותית את עלויות החישוב ומגבירה את יעילות המודל.

אפליקציית deepseeek מותקנת באייפון
מודל השפה משתפר ללא צורך בהכשרה אנושית (צילום: רפרודוקציה/TechCrunch)

אם תסביר את זה בצורה פשוטה יותר, זה יהיה כמו שיש צוות גדול של מומחים זמין לכל סוגי המשימות, אבל להתקשר רק לאלו המתאימים ביותר לבצע זאת במקרה ספציפי, מה שמבטיח שימוש יעיל ומומחיות בשירות.

O DeepSeek-V3 גם מעסיק טכניקות זיקוק, מה שאומר שהוא מעביר ידע ויכולות מדגמים גדולים יותר לדגמים קטנים ויעילים יותר. זה כמו מורה שמעביר את הידע שלו לתלמיד, ומאפשר לתלמיד לבצע משימות עם מיומנות דומה אך עם פחות ניסיון או משאבים.

התוצאה היא AI שתופס פחות מקום ומשאבים, עם יעילות גבוהה לעבודה במכשירים קטנים יותר, כגון סמארטפונים ומחשבים ניידים. כדי להפוך את האפליקציה לזמינה לסמארטפונים וגם בגרסת האינטרנט, החברה השתמשה ב-DeepSeek R1 כבסיס והפכה אותו לאפליקציה.

מודל קוד פתוח

אדם שעובד על AI בקוד פתוח עמוק
קוד פתוח מסייע בפיתוח תכונות חדשות (צילום: גילוי נאות)

בנוסף לשילוב טכניקות יעילות וביצועים, המודלים מנצלים גם את שיתוף הפעולה הגלום בפרויקטי עיצוב. קוד פתוח (או קוד פתוח, באנגלית).

כאן, בניגוד לחברה כמו OpenAI, שעובדת באופן פרטי על פיתוח AIs, למודלים של DeepSeek יש את הקוד שלהם זמין באינטרנט, וניתן לגשת אליהם, לבדוק ואף לתקן אותם על ידי קהילת המפתחים העולמית, מה שמשקף גם יותר שקיפות ו אמון בתוצאות המוצגות.

למעשה, החברה רוצה לעודד כל אחד לבדוק את הדגמים שלה ומשחררת רישיונות לאנשי המקצוע שלה כדי להקל על חברות אחרות להשתמש בהם.

האסטרטגיה גם מחזקת את התחרותיות, מושכת כישרונות ומדגישה את עמדת המנהיגות של DeepSeek, בסוג של שיווק חופשי. החברה לא נהנית מכך באופן ישיר, אלא תנצל את האימוץ ההמוני של המודל, ביכולת לייצר רווחים באמצעות שירותים משלימים, כמו תמיכה טכנית או גרסאות פרימיום, תוך טיפוח אקוסיסטם שיתופי וחדשני.

מספר 1 בחנויות אפליקציות

אפליקציית Deepseek בחנות האפליקציות הברזילאית
אפליקציה עוררה סקרנות ברחבי העולם (צילום מסך: Victor Pacheco/Showmetech)

הסקרנות לגבי DeepSeek לא הייתה רק בקרב מנכ"לים ומהנדסי טכנולוגיה.

הושק ב-20 בינואר, ה-R1, אפליקציית DeepSeek לאייפון וסמארטפונים אנדרואיד, נראה שהם הולכים בנתיב המוצלח של המתחרה ChatGPT. זה כבר האפליקציה שהורדת הכי הרבה בחנות האפליקציות של אפל האמריקאית והשנייה בברזיל, מאחורי המתחרה של OpenAI בלבד.

Na חנות Play, חנות אנדרואיד, גם על ההצלחה אין עוררין: ברחבי העולם, הצ'טבוט הסיני כבר הותקן יותר ממיליון פעמים.

סם אלטמן, מייסד והמנכ"ל הנוכחי של OpenAI, דיבר על הצלחתה של DeepSeek. הוא ציין שהוא עוקב אחר מה שבינה מלאכותית סינית יכולה לעשות ושהדגם הראשון מרשים. ראה את הציוצים והתרגומים למטה.

ההצהרה של סם אלטמן על AI הסינית Deepseek
ההצהרה של סם אלטמן על AI DeepSeek הסינית (צילום מסך: Victor Pacheco/Showmetech)

ה-deepseek r1 הוא דגם מרשים, במיוחד ביחס למה שהם יכולים לספק במחיר. ברור שנספק דגמים הרבה יותר טובים וזה גם מרענן לגיטימי שיש מתחרה חדש! נוציא כמה מהדורות.

אבל הכי חשוב, אנחנו נרגשים להמשיך ולבצע את המטרות שלנו ומאמינים שיותר מחשוב חשוב עכשיו מתמיד כדי להצליח במשימתנו.

העולם ירצה להשתמש בהרבה בינה מלאכותית ובאמת יופתע מהדגמים הבאים של הדור הבא. אנו מצפים להביא לכולכם את AGI ומעבר לכך.

סם אלטמן על הצלחת הבינה המלאכותית הסינית DeepSeek.

השלכות והטיה פוליטית

הכירו את Deepseek, הבינה המלאכותית הסינית שמאיימת על צ'אט. הבינו את המקרה של הסטארט-אפ הסיני שעוקר את ענקיות הבינה המלאכותית האמריקאיות וגרם להפסדים של יותר מטריליון דולר בנאסד"ק
הכירו את DeepSeek, הבינה המלאכותית הסינית שמאיימת על ChatGPT

אבל עם הצלחה מתעוררים גם חשדות. מומחים מטילים ספק האם המספר הכולל של מעבדי הגרפיקה המשמשים לאימון דגמי DeepSeek היה נמוך מדיווח, מתוך כוונה להסתיר את השימוש בחומרת NVIDIA שנאסרה לאחרונה למכירה בסין, עקב מלחמת הסחר עם ארצות הברית. אבל החברה מכחישה עובדה זו, ומציינת שהיא הצליחה לאמן את הדגם שלה אפילו עם GPUs בעלות הספק נמוך.

ישנם גם סימנים של צנזורה בכלי, בהתאם למצוות או ההטיה הפוליטית של המפלגה הקומוניסטית הסינית. לדוגמה, כאשר נשאל על ה "טבח בכיכר טיאננמן ב-1989 בבייג'ינג", שבו מאות פעילים נהרגו או נפצעו על ידי הצבא הסיני, ה-AI מסרב לענות על השאלה.

אותו הדבר קורה כאשר ה-AI נשאל על הסכסוך בין סין לטייוואן. DeepSeek מזכיר כי טייוואן היא חלק מסין וזה "הממשלה הסינית מחויבת לעקרון סין האחת ומבקשת את איחודה השלווה של המדינה.

צ'אט חיפוש עמוק
צ'אט DeepSeek מציג חשיבה לטובת המפלגה הקומוניסטית הסינית (צילום מסך: Victor Pacheco/Showmetetech)

מה הלאה?

צ'אט חיפוש עמוק
DeepSeek הוא הימור ואיום גדולים עבור חברות טכנולוגיה (צילום מסך: Victor Pacheco/Showmetech)

האפשרות לקבל מודלים כל כך יעילים של AI, בעלויות תשתית נמוכות משמעותית, גורמת למשקיעים לחשוב מחדש על קנייה או אפילו מכירת מניותיהם בחברות טכנולוגיה המתמקדות במגזר זה. 

אחת האגדות של הון סיכון אֲמֶרִיקָאִי, מארק אנדרסן, רואה בהופעתה של DeepSeek את "רגע הספוטניק של AI", בהתייחס לשיגור הלוויין ההיסטורי הראשון למסלול ב-1957, שסימן את הרגע שבו ברית המועצות עלתה זמנית על ארצות הברית בתחום טכנולוגיית החלל.

העובדה היא שהעליונות האמריקאית בתחום הבינה המלאכותית הועמדה בספק. ומסיבה זו, סביר להניח שתוכרז תגמול מצד הממשל האמריקאי, אולי באמצעות סנקציות נוספות על מסחור טכנולוגיות ושבבים אמריקאים לחברות סיניות.

בתגובה למקרה, הנשיא החדש דונלד טראמפ כינה את עלייתה של חברת DeepSeek הסינית "קריאת השכמה" לתעשיית הטכנולוגיה האמריקאית, סימן לכך שתגובה צריכה לבוא בקרוב.

נעקוב אחר הנושא מקרוב. בינתיים ספר לנו הערה: האם אתה חושב ש-DeepSeek יכול לקחת את מנהיגות ChatGPT?

ראה את הסרטון

ראה גם

עם מידע: יאהו l קרקעd חֲדָשׁוֹת l מידע כסף l פורבס (1 e 2)


גלה עוד על Showmetech

הירשם כדי לקבל את החדשות האחרונות שלנו בדוא"ל.

השאר תגובה
הודעות קשורות