איך אפליקציית שאזאם עובדת?

איך אפליקציית Shazam  עובדת?

לחברת שאזאם יש ספרייה של יותר מ -8 מיליון שירים, והיא פיתחה שיטה לחלק כל קטע מוזיקלי ולתת לו חתימה דיגיטלית פשוטה – סוג של קוד ייחודי לכל רצועה.

הטכנולוגיה היא למעשה יצירת טביעת אצבע של כל חלק בשיר (החלקים חופפים אחד לשני) . כאשר אתם מפעילים את האפליקציה בטלפון שלכם כאשר שיר שאתם רוצים לזהות מתנגן, Shazam הופך את השיר לחתימה באותה שיטה. החתימה נשלחת לשרתים של שאזאם ואז זה רק עניין של התאמת דפוס- Shazam מחפשת בספרייה איזו דגימה הכי דומה למה שהושמע; כאשר הדגימה הדומה נמצאה, האפליקציה יודעת שזה השיר שלכם.

אז השאלה החשובה באמת היא איך מבצעים את  טביעות אצבע כך שיהיה ניתן לזהות את השיר?  המדען הראשי של Shazam הסביר עוד ב2003 שלמעשה שירים מכילים יותר מידי מידע וצריך חתימה פשוטה כדי לנסות לזהות את השיר. הרעיון הוא "מה אם נתעלם מכמעט כל דבר בשיר ונתמקד רק בכמה רגעים "אינטנסיביים" יחסית?" כך שאזאם יוצרת מבט פנורמי לכל שיר במסד הנתונים שלה, או במונח המקצועי ספקטוגרם – גרף המתאר שלושה מימדים של מוסיקה: תדירות לעומת משרעת (אפליטודה) מול זמן. האלגוריתם מבחין רק באותן נקודות שמייצגות את הפסגות של ציורי הגרף המכילים "תוכן אנרגיה גבוה יותר" מכל שאר התווים שסביבו. בפועל, זה נראה לייצג עד שלוש נקודות נתונים לשנייה לכל שיר.

עוד באותו נושא:  מה ההבדל בין פסנתר לאורגן? 🎹

אפשר היה לחשוב שהתעלמות כמעט מכל המידע בשיר תוביל לתאמות לא מדויקות, אבל הטכניקה של טביעת האצבע של Shazam מחוסנת במידה ניכרת על הפרעות – היא יכולה להתאים שירים בסביבות רועשות ובקליטה סלולרית לא טובה. החברה גם מצאה לאחרונה דרך להתאים למוזיקה מואצת במעט (כמו שתקליטני מועדונים לפעמים מבצעים התאמה לטמפו ספציפי או כמו שעושים ברדיו כדי להתאים שירים "לזמנים מדוייקים" לפני הפסקה של פרסומות). שאזאם  יכולה להבחין בין הגרסאות השונות של אותו שיר.

שיעור הההצלחה והשגיאה של שאזאם הוא סודי, אבל מדובר במעל 95 אחוז. מה שברור הוא שהשירות טוב מספיק כדי לגרום לאנשים לחזור ולהשתמש בו. על פי פי מה שהחברה מפרסמת, משתמש ממוצע מחפש (או מזהה) שירים שמונה פעמים בחודש. הסיבה הנפוצה ביותר Shazam נכשל ת בלזהות שיר היא כי אין לה מספיק נתונים. המערכת צריכה לפחות חמש שניות של מוסיקה כדי למצא התאמה, ולפעמים אנשים מפעילים אותה בדיוק כאשר השיר מסתיים. יש גם שגיאות לעתים קרובות כאשר אנשים מחפשים הופעות חיות כיוון שזו לא גרסא  כפי שהיא מבוצעת באלבום.

עוד באותו נושא:  מה ההבדל בין גיטרה חשמלית לגיטרה בס? 🎸

כתיבת תגובה