Netflix-da san'at asarlarini shaxsiylashtirish

Ashok Chandrashekar, Fernando Amat, Justin Basilico va Tony Jebara tomonidan

Ko'p yillar davomida Netflix shaxsiylashtirilgan tavsiyalar tizimining asosiy maqsadi har bir a'zoning oldida o'z vaqtida kerakli nomlarni olish edi. Katalogda minglab sarlavhalar va yuz milliondan ortiq hisoblar mavjud turli xil a'zolar bazasi mavjud bo'lib, har bir a'zoga to'g'ri keladigan nomlarni tavsiya etish juda muhimdir. Lekin tavsiyanoma ishi shu bilan tugamaydi. Nega biz tavsiya qiladigan biron bir nom haqida qayg'urishingiz kerak? Sizning qiziqishingizni buzadigan yangi va notanish nom haqida nima deyishimiz mumkin? Sarlavha tomosha qilishga arziydi, deb sizni qanday ishontiramiz? Ushbu savollarga javob berish bizning a'zolarimizga, ayniqsa notanish unvonlar uchun ajoyib tarkibni ochishda yordam beradi. Ushbu muammoni hal qilishning asosiy yo'nalishlaridan biri bu unvonlarni tasvirlashda foydalanadigan rasmlar yoki rasmlarni ko'rib chiqishdir. Agar sarlavha aks ettirilgan san'at asarlari sizni o'ziga jalb qiladigan narsani o'z ichiga olgan bo'lsa, unda bu sarlavha uchun shlyuz bo'lib xizmat qiladi va sizga vizual "dalillar" beradi, chunki bu sarlavha siz uchun yaxshi bo'lishi mumkin. San'at asarida siz tanigan aktyorni ta'kidlashingiz, avtoulovni haydash kabi hayajonli lahzalarni suratga olishingiz yoki film yoki teleko'rsatuvning mohiyatini aks ettiruvchi dramatik voqea bo'lishi mumkin. Agar biz ushbu mukammal rasmni o'zingizning sahifangizga taqdim etsak (va ular aytganidek: rasm ming so'zga teng), unda ehtimol, ehtimol, siz buni sinab ko'rishingiz mumkin. Bu Netflix an'anaviy media-takliflardan ajralib turadigan yana bir usul: bizda bitta mahsulot yo'q, lekin 100 milliondan ortiq turli xil mahsulotlar, har birimiz uchun individual tavsiyalar va shaxsiylashtirilgan vizual materiallar mavjud.

Netflix-ning badiiy asarisiz. Tarixiy tavsiyalarimiz algoritmlari sahifani qanday ko'rishgan.

Oldingi ishimizda, biz barcha a'zolarimiz orasida har bir sarlavha uchun bitta mukammal badiiy asarni topish harakatini muhokama qildik. Ko'p qurolli bandit algoritmlari orqali biz nom uchun eng yaxshi badiiy asarni qidirib topdik, deyishadi Stranger Things, bu bizning a'zolarimizning eng katta qismidan eng ko'p spektaklni oladi. Biroq, ta'm va afzalliklarning xilma-xilligi inobatga olinsa, har bir a'zo uchun sarlavhaning o'ziga xos jihatlarini yoritib beradigan eng yaxshi badiiy asarni topsak yaxshi bo'lmaydimi?

Har birimiz shaxsiylashtirish algoritmidan 5% dan yuqori taassurotlarni oladigan g'alati narsalar uchun rasm. Turli xil tasvirlar shou mavzularining kengligini qamrab oladi, har qanday bitta tasvir tasviridan tashqariga chiqadi.

Ilhom sifatida, san'at asarlarini shaxsiylashtirish ma'noga ega bo'lgan stsenariylarni ko'rib chiqaylik. Turli a'zolar turli xil ko'rish tarixlariga ega bo'lgan quyidagi misollarni ko'rib chiqing. Chapda uchta sarlavha qo'yilgan, ular oldin a'zolar tomonidan ko'rib chiqilgan. O'qning o'ng tomonida, a'zo biz ularga tavsiya qilgan biron bir film uchun olgan buyumlari.

Keling, "Yaxshi iroda ovi" filmini tasvirlash uchun foydalanadigan rasmni shaxsiylashtirishga harakat qilaylik. Bu erda biz qarorni a'zoning turli janrlar va mavzularni qanchalik afzal ko'rishi asosida shaxsiylashtirishimiz mumkin. Agar biz Mett Deymon va Minni Driverdan iborat asarlarimizni namoyish qilsak, ko'plab romantik filmlarni tomosha qilgan kimsa yaxshi iroda oviga qiziqishi mumkin, holbuki ko'plab komediyalarni ko'rgan a'zo, agar biz Robin Uilyams, taniqli komediyachi.

Boshqa bir stsenariyda, "Pulp Fiction" filmi uchun shaxsiy tarkibni shaxsiylashtirishga aktyorlar uchun har xil imtiyozlar qanday ta'sir qilishi mumkinligini tasavvur qiling. Uma Turman ishtirokidagi ko'plab filmlarni tomosha qilgan a'zo, Uma o'z ichiga olgan "Pulp Fiction" asariga ijobiy javob berishi mumkin. Ayni paytda, Jon Travoltaning muxlisi, agar badiiy asarda Jon bo'lsa, Pulp Fictionni tomosha qilishni ko'proq qiziqtirishi mumkin.

Albatta, san'at asarlarini shaxsiylashtirishning barcha stsenariylari bu aniq va ravshan emas. Shunday qilib, biz qo'lda ishlab chiqarilgan bunday qoidalarni sanab o'tmaymiz, aksincha ma'lumotlarga tayanib, qanday signallardan foydalanish kerakligini aytamiz. Umuman olganda, san'at asarlarini shaxsiylashtirish orqali biz har bir sarlavha har bir a'zo uchun eng yaxshi oyoqni oldinga surishga va shu bilan a'zo tajribamizni yaxshilashga yordam beramiz.

Muammolar

Netflix-da biz shaxsiylashtirishni o'z ichiga olamiz va bizning a'zolarimiz tajribasining ko'p qirralarini, jumladan, bosh sahifa uchun tanlagan satrlar, ushbu satrlar uchun tanlagan sarlavhalar, biz namoyish qiladigan galereyalar, yuboradigan xabarlarimiz va boshqalar. Biz shaxsiylashtiradigan har bir yangi yo'nalish noyob qiyinchiliklarga ega; biz namoyish qiladigan san'at asarini shaxsiylashtirish istisno emas va shaxsiylashtirishning turli xil qiyinchiliklarini keltirib chiqaradi. Tasvirni shaxsiylashtirishning bir muammosi shundaki, biz taqdim etgan har bir joyda har bir sarlavhani namoyish qilish uchun badiiy asarni tanlab olishimiz mumkin. Bundan farqli o'laroq, tavsiya etishning odatiy sozlamalari a'zoga bir nechta tanlovlarni taqdim etishimizga imkon beradi, bu erda biz tanlagan elementdan ularning afzalliklari haqida bilib olamiz. Bu shuni anglatadiki, rasm tanlash tovuq va tuxum muammosi yopiq pastadirda ishlaydi: agar biron bir a'zo sarlavhani o'ynasa, biz uni o'sha a'zoga taqdim etishga qaror qilgan rasmdan kelib chiqishi mumkin. Biz tushunmoqchi bo'lgan narsa, nom uchun san'at asarining muayyan qismini taqdim etishda, a'zoning unvonni o'ynashiga (yoki o'ynamaslikka) ta'sir qilishi va a'zo qaysi rasmni taqdim etganimizdan qat'i nazar, unvonni o'ynashi (yoki bo'lmasligi). Shuning uchun badiiy asarni shaxsiylashtirish an'anaviy tavsiyanoma muammosining ustiga chiqadi va algoritmlar bir-biri bilan birgalikda ishlashi kerak. Albatta, badiiy asarni qanday shaxsiylashtirishni to'g'ri o'rganish uchun badiiy asarning qaysi qismi a'zo uchun yaxshiroq bo'lganligini ko'rsatuvchi signallarni topish uchun juda ko'p ma'lumot to'plash kerak.

Yana bir qiyin vazifa - a'zolarimizni seanslar orasidagi sarlavha uchun namoyish etayotgan san'at asarining o'zgarishi ta'sirini tushunish. O'zgarish san'ati sarlavhani tanib olishni kamaytiradi va nomni boshqa joyni aniqlashni qiyinlashtiradimi, masalan, agar a'zo ilgari qiziqish bildirgan bo'lsa-yu, lekin uni hali ko'rmagan bo'lsa? Yoki, san'at asarining o'zgarishi, tanlov yaxshilanganligi sababli, a'zoni qayta ko'rib chiqishga majbur qiladimi? Agar biz biron bir a'zoga taqdim etish uchun yaxshiroq san'at asarini topsak, ehtimol undan foydalanishimiz kerak; ammo doimiy o'zgarishlar odamlarni chalkashtirib yuborishi mumkin. Rasmlarni o'zgartirish, shuningdek, a'zolarni sarlavha bilan qiziqishga sabab bo'lganligi aniq bo'lmagani uchun, bu atribut muammosini keltirib chiqaradi.

Keyinchalik, bitta sahifada yoki seansda tanlagan boshqa san'at asarlariga nisbatan san'at asarining qanday ishlashini tushunish qiyin. Ehtimol, bosh qahramonning qalin tanlovi sahifadagi sarlavha uchun ishlaydi, chunki u boshqa san'at asarlari bilan taqqoslanmaydi. Ammo, agar har bir sarlavha bir xil tasvirga ega bo'lsa, unda umuman sahifalar unchalik yaxshi ko'rinmasligi mumkin. Badiiy asarning har bir parchasini alohida-alohida ko'rib chiqish etarli bo'lmasligi mumkin va sahifada va seansda sarlavhalar bo'yicha turli xil rasmlarni qanday tanlash haqida o'ylashimiz kerak. Boshqa sarlavhalar uchun san'at asaridan tashqari, sarlavha uchun qilingan badiiy asarning samaradorligi boshqa dalillar va aktivlarning (masalan, sinoplar, treylerlar va boshqalar) turiga bog'liq bo'lishi mumkin. Shunday qilib, biz har xil tanlovga muhtoj bo'lishimiz mumkin, unda har biri o'z a'zolarini jalb qilishi mumkin bo'lgan sarlavhaning qo'shimcha tomonlarini ta'kidlashi mumkin.

Samarali shaxsiylashtirishga erishish uchun, shuningdek, har bir nom uchun yaxshi san'at asarlari to'plami kerak. Bu shuni anglatadiki, "bosish" ni oldini olish uchun biz har bir narsaga jalb qilinadigan, ma'lumot beradigan va titulning vakili bo'lgan bir nechta aktivlarga muhtojmiz. Sarlavha uchun rasmlar to'plami tarkibning turli tomonlariga qiziqqan keng potentsial auditoriyani qamrab olishi uchun etarlicha xilma-xil bo'lishi kerak. Axir, san'at asarini qanchalik qiziqarli va mazmunli qilish haqiqatan ham uni ko'rgan odamga bog'liq. Shuning uchun biz nafaqat sarlavhadagi turli mavzularni, balki turli estetika mavzularini ham yoritadigan san'at asariga ega bo'lishimiz kerak. Bizning rassomlarimiz va dizaynerlarimiz jamoalari ko'p qirrali rang-barang rasmlarni yaratishga intilishadi. Shuningdek, ular shaxsiylashtirish algoritmlarini hisobga oladilar, ular badiiy asar yaratish uchun rasmlarni ijodiy jarayonida tanlaydilar.

Va nihoyat, san'at asarlarini miqyosda shaxsiylashtirish uchun muhandislik muammolari mavjud. Bitta qiyinchilik shundaki, bizning a'zolarimiz tajribasi juda vizual va shuning uchun juda ko'p tasvirlarni o'z ichiga oladi. Shunday qilib, har bir aktiv uchun moslashtirilgan tanlovdan foydalanish sekundiga 20 milliondan oshiq so'rovlarni eng past darajada kutish bilan hal qilishni anglatadi. Bunday tizim kuchli bo'lishi kerak: bizning UI-da san'at asarini to'g'ri taqdim etmaslik tajribani sezilarli darajada yomonlashtiradi. Bizning shaxsiylashtirish algoritmimiz sarlavha boshlanganda tezda javob berishi kerak, bu esa sovuq boshlangan vaziyatda tezda shaxsiylashtirishni o'rganishni anglatadi. Keyin, ishga tushirilgandan so'ng, algoritm doimiy ravishda moslashishi kerak, chunki badiiy asarning samaradorligi vaqt o'tishi bilan o'zgarishi mumkin, chunki sarlavha ham hayot aylanishi davomida o'zgaradi va a'zolar didi o'zgaradi.

Kontekstual banditlarga yaqinlashish

Netflix tavsiyalarining ko'p qismi mashina o'rganish algoritmlari bilan ishlaydi. An'anaga ko'ra, biz a'zolarimiz xizmatdan qanday foydalanishi to'g'risida ma'lumotlar to'playdi. Keyin ushbu ma'lumotlar to'plamida yangi mashina o'rganish algoritmini ishga tushiramiz. Keyinchalik, biz ushbu yangi algoritmni A / B testi orqali joriy ishlab chiqarish tizimiga qarshi sinovdan o'tkazamiz. A / B testi yangi algoritm bizning hozirgi ishlab chiqarish tizimimizdan yaxshiroq ekanligini yoki a'zolarning tasodifiy to'plamida sinab ko'rishimizga yordam beradi. "A" guruhining a'zolari joriy ishlab chiqarish tajribasiga ega bo'lishadi, "B" guruhi a'zolari esa yangi algoritmga ega bo'lishadi. Agar B guruhidagi a'zolar Netflix bilan faolroq bo'lsa, biz yangi algoritmni barcha a'zolar populyatsiyasiga tarqatamiz. Afsuski, ushbu partiyaviy yondashuv afsusda: uzoq vaqt davomida ko'plab a'zolar yaxshi tajribadan foyda olishmadi. Bu quyidagi rasmda ko'rsatilgan.

Ushbu afsuslanishni kamaytirish uchun biz ommaviy mashinalarni o'qitishdan uzoqlashamiz va onlayn mashinani o'rganishni ko'rib chiqamiz. San'at asarlarini shaxsiylashtirish uchun biz foydalanadigan o'ziga xos onlayn o'rganish doirasi - bu kontekstli banditlar. To'liq ma'lumotlar to'plamini yig'ish, modelni o'rganishni kutish va A / B testi yakunlanishini kutishning o'rniga, kontekstli banditlar har bir a'zo va kontekst uchun sarlavha uchun maqbul shaxsiylashtirilgan san'at asarini tezda aniqlaydilar. Qisqacha aytganda, kontekstli banditlar - bu onlayn o'rganish algoritmlari sinfi bo'lib, o'rganilgan modelni har bir a'zo kontekstida qo'llash foydasi bilan doimiy asosda ob'ektiv modelni o'rganish uchun zarur bo'lgan ma'lumotni yig'ish xarajatlarini qoplaydi. Oldingi shaxsiylashtirilgan rasm tanlashda biz kontekstli bo'lmagan banditlardan foydalanganmiz, u erda kontekstdan qat'i nazar g'alaba qozongan rasmni topdik. Shaxsiylashtirish uchun, a'zo kontekst bo'lib, biz har xil a'zolar rasmlarga har xil javob berishini kutamiz.

Kontekstli banditlarning asosiy xususiyati shundaki, ular afsuslanishni kamaytirishga mo'ljallangan. Yuqori darajada, kontekstual bandit uchun mashg'ulot ma'lumotlari o'rganilgan modelning bashoratida boshqariladigan randomizatsiyani kiritish orqali olinadi. Tasodifiylashtirish sxemalari oddiy epsilon ochko'z formulalardan tortib, bir xil tasodifiylik bilan yopiq pastadir sxemalariga qadar o'zgarib turishi mumkin, ular modeldagi noaniqlik funktsiyasi sifatida tasodifiylik darajasiga moslashadi. Biz ushbu jarayonni ma'lumotlarni qidirish deb keng tushunamiz. Sarlavha olish mumkin bo'lgan nomzodlik asarlari soni va tizim joylashtiriladigan aholining umumiy soni ma'lumotlar qidirish strategiyasini tanlash to'g'risida xabar beradi. Bunday kashfiyot bilan biz har bir san'at asarini tanlash uchun tasodifiylik haqida ma'lumotni kiritamiz. Ushbu ro'yxatga olish bizga tanlangan tanlov moyilligini to'g'rilashga imkon beradi va shu bilan keyinchalik ta'riflanganidek, avtoulov modelini ob'ektiv baholashni amalga oshiradi.

Kontekstli banditlardagi qidiruv odatda a'zolik sessiyasida san'at asarimizni tanlab olishimiz ushbu sessiya uchun oldindan taxmin qilingan eng yaxshi tasvirni ishlatmasligi sababli qimmatga tushadi (yoki pushaymon). Ushbu tasodifiylashtirish a'zo tajribasiga (va shunga mos ravishda bizning o'lchovlarimizga) qanday ta'sir qiladi? Yuz milliondan ortiq a'zolariga ega bo'lgan joylarda, kashfiyot tufayli qilingan pushaymon odatda juda kichikdir va bizning katta a'zolarimiz bazasida amortizatsiya qilinadi, har bir a'zo katalogning kichik bir qismi uchun san'at asarlari haqida fikr bildirishga yordam beradi. Bu har bir a'zo uchun qidiruv xarajatlarini ahamiyatsiz qiladi, bu bizning a'zolarimiz tajribasining asosiy jihatlarini boshqarish uchun kontekstli banditlarni tanlashda muhim ahamiyatga ega. Kontekstli banditlar bilan tasodifiy va qidiruv ishlari, agar qidiruv xarajatlari yuqori bo'lsa, kamroq mos keladi.

Onlayn qidiruv sxemamizda biz har bir (a'zo, sarlavha, rasm) yozuv uchun yozuvlarni to'playdigan ma'lumot to'plamini olamiz, bu tanlov sarlavha bilan o'ynalganmi yoki yo'qmi. Bundan tashqari, biz san'at asarlari tanlovlari tez-tez o'zgarib turmasligi uchun qidiruvni boshqarishimiz mumkin. Bu ma'lum bir san'at asariga a'zoligi bilan bog'liqlikni aniqroq aniqlash imkonini beradi. Shuningdek, biz "chertish" rasmini tavsiya etadigan modelni o'rganishdan qochish uchun har bir kuzatuv uchun yorliqni ehtiyotkorlik bilan aniqlaymiz: a'zolarni o'ynashni boshlashiga olib keladigan, ammo oxir-oqibat past sifatli jalb qilish.

Model o'qitish

Ushbu onlayn o'rganish sharoitida biz har bir a'zoga ularning kontekstiga qarab eng yaxshi rasmlarni tanlash uchun kontekstli bandit modelimizni o'rgatamiz. Odatda har bir sarlavhada bir necha o'ntagacha nomzodlik asarlari rasmlari mavjud. Tanlash modelini o'rganish uchun a'zolar uchun rasmlarni sarlavhalar bo'yicha mustaqil ravishda tartiblash orqali muammoni soddalashtirishni ko'rib chiqamiz. Hatto ushbu soddalashtirish bilan biz hali ham sarlavhalar bo'yicha a'zolar rasmining afzalliklarini bilib olishimiz mumkin, chunki har bir rasm nomzodiga bizda u bilan tanishtirilgan va sarlavha bilan shug'ullangan va u bilan birga kelgan va qatnashmagan ba'zi a'zolar mavjud. Ushbu afzalliklarni har bir a'zo (a'zo, sarlavha, rasm) uchun, a'zoning sifatli ishtirok etish ehtimolini taxmin qilish uchun modellashtirish mumkin. Bular nazorat qilinadigan o'rganish modellari yoki ma'lumotni qidirish bilan eng yaxshi bashorat qilishni aqlli ravishda muvozanatlashtiradigan Thompson Sampling, LinUCB yoki Bayesian metodlari yordamida kontekstual banditlar tomonidan boshqarilishi mumkin.

Potentsial signallar

Kontekstli banditlarda kontekst odatda modelga kirish sifatida taqdim etilgan xususiyat vektori sifatida taqdim etiladi. Ushbu muammoning xususiyatlari sifatida foydalanishimiz mumkin bo'lgan ko'plab signallar mavjud. Xususan, biz a'zoning ko'plab xususiyatlarini ko'rib chiqishimiz mumkin: ular o'ynagan nomlar, nomlar janri, a'zoning aniq nom bilan o'zaro munosabatlari, mamlakati, ularning til imtiyozlari, a'zo ishlatadigan qurilma, va hokazo. kunning vaqti va haftaning kuni. Bizning algoritmimiz rasmlarni shaxsiylashtirilgan tavsiya mexanizmi bilan birgalikda tanlaganligi sababli, biz turli xil tavsiyalar algoritmlari sarlavha haqida qanday fikrda bo'lishidan qat'i nazar signallardan foydalanishimiz mumkin, qanday tasvirni aks ettirishdan qat'i nazar.

Muhim e'tiborga olinadigan narsa shundaki, ba'zi rasmlar tabiiy ravishda nomzodlar pulidagi boshqa rasmlarga qaraganda yaxshiroqdir. Biz ma'lumotlarni o'rganishda barcha rasmlarning umumiy sur'atlarini kuzatmoqdamiz, bu shunchaki taassurotlar soniga bo'lingan sifatli pyesalar soni. Shaxsiyatsiz san'at asarlarini tanlab olish bo'yicha avvalgi ishimiz butun populyatsiya uchun tanlangan eng yaxshi rasmni aniqlash uchun tortishish stavkalaridagi umumiy farqlardan foydalangan. Bizning yangi kontekstual shaxsiylashtirilgan modelimizda umumiy qabul qilish stavkalari hali ham muhim bo'lib, individuallashtirish hali ham shaxsiylashtirilmagan model reytingiga mos keladigan tanlovlarni tiklaydi.

Rasm tanlash

A'zolarga rasm asarlarini maqbul tayinlash - bu mavjud rasmlar sarlavhasidan eng yaxshi nomzod rasmini tanlash uchun tanlovdir. Model yuqoridagi kabi o'qitilgandan so'ng, biz har bir kontekst uchun rasmlarni tartiblash uchun foydalanamiz. Model ma'lum bir a'zo kontekstida berilgan rasm uchun o'ynash ehtimolini bashorat qiladi. Biz nomzodlarning rasmlar to'plamini ushbu ehtimolliklar bo'yicha tartiblaymiz va eng katta ehtimollik bilan rasmni tanlaymiz. Aynan shu a'zoga taqdim etgan rasmimiz bu.

Ish faoliyatini baholash

Oflayn

Tarkibiy bandit algoritmlarimizni haqiqiy a'zolarga onlayn joylashtirishdan oldin ularni baholash uchun biz takrorlash [1] deb nomlangan oflayn texnikadan foydalanishimiz mumkin. Ushbu usul bizga qayd qilingan qidiruv ma'lumotlari asosida soxtalashtirilgan savollarga javob berishga imkon beradi (1-rasm). Boshqacha qilib aytganda, agar biz turli xil algoritmlarni xolisona qo'llagan bo'lsak, turli xil stsenariylar bo'yicha tarixiy sessiyalarda nima bo'lganini oflayn ravishda taqqoslashimiz mumkin.

1-rasm: Ro'yxatdan o'tkazilgan ma'lumotlardan takrorlash metrikasini hisoblashning oddiy misoli. Har bir a'zo uchun tasodifiy rasm tayinlangan (yuqori qator). Tizim taassurotni qayd etdi va profil sarlavha (yashil doira) o'ynadimi yoki yo'qmi (qizil doira). Yangi model uchun takrorlash metrikasi tasodifiy tayinlash va model tayinlanishi bir xil bo'lgan (qora kvadrat) profillarni taqqoslash va ushbu kichik qismning tortish qismini hisoblash yo'li bilan hisoblanadi.

Replay bizga ishlab chiqarishda ishlatiladigan algoritm emas, balki yangi algoritm orqali tanlangan rasmlarni hipotetik tarzda taqdim etganimizda, a'zolar bizning sarlavhalarimiz bilan qanday shug'ullanishlarini ko'rishimizga imkon beradi. Rasmlar uchun biz bir nechta o'lchovlarga, xususan yuqorida tavsiflangan tortishish qismlariga qiziqamiz. 2-rasmda kontekstli bandit yondoshuvi tasodifiy tanlangan yoki kontekstsiz bo'lmagan banditlarga nisbatan katalogdagi o'rtacha tortishish sonini ko'paytirishga yordam beradi.

2-rasm: Turli algoritmlar uchun olingan rasmni o'rganish ma'lumotlarini takrorlashga asoslangan rasmning o'rtacha tortish qismi (qanchalik yaxshi bo'lsa). Tasodifiy (yashil) siyosat tasodifiy ravishda bitta tasvirni tanlaydi. Oddiy Bandit algoritmi (sariq) tasvirni eng yuqori tortish qismiga ega tanlaydi. Kontekstli bandit algoritmlari (ko'k va pushti) turli a'zolar uchun turli xil rasmlarni tanlash uchun kontekstdan foydalanadi.3-rasm: Profil turiga qarab kontekstual tasvirni tanlash namunasi. Komediya asosan komediya sarlavhalarini ko'radigan profilga tegishli. Xuddi shunday, Romantika asosan romantik nomlarni tomosha qiladi. Kontekstual bandit mashhur komediyachi Robin Uilyamsning komediya yo'naltirilgan profillari uchun tanlaydi, shuningdek, romantikaga moyil bo'lgan profillar uchun o'padigan juftlik tasvirini tanlaydi.

Onlayn

Oflayn rejimda ko'plab turli xil modellar bilan tajriba o'tkazgandan so'ng va takroran yozishda sezilarli darajada ko'paygan modellarni topgandan so'ng, biz eng istiqbolli shaxsiylashtirilgan kontekstli banditlarni shaxsiy bo'lmagan banditlarga qarshi taqqoslash uchun A / B testini o'tkazdik. Biz gumon qilganimizdek, shaxsiylashtirish bizning asosiy o'lchovlarimizda sezilarli darajada ko'tarildi. Oflayn rejimda o'lchagan narsalar bilan modellar bilan Internetda ko'rgan narsalar o'rtasida oqilona bog'liqlikni ko'rdik. Onlayn natijalar, shuningdek, ba'zi qiziqarli ma'lumotlarni keltirib chiqardi. Masalan, a'zoning sarlavha bilan oldindan aloqasi bo'lmagan holatlarda, shaxsiylashtirishni yaxshilash kattaroq bo'ldi. Buning ma'nosi bor, chunki sarlavha unchalik tanish bo'lmagan taqdirda badiiy asar kimgadir muhimroq bo'ladi degan umiddamiz.

Xulosa

Ushbu yondashuv bilan biz shaxsiy tavsiyalarimiz va xizmatimiz uchun san'at asarlarini tanlashni shaxsiylashtirish bo'yicha birinchi qadamlarimizni qo'ydik. Bu bizning a'zolarimiz yangi tarkibni kashf etishlarining mazmunli yaxshilanishiga olib keldi ... shuning uchun biz buni hammaga tarqatdik! Ushbu loyiha nafaqat biz tavsiya qilgan narsani, balki o'z a'zolarimizga qanday tavsiya qilishimizni shaxsiylashtirishning birinchi misoli. Ammo ushbu boshlang'ich yondashuvni kengaytirish va takomillashtirish uchun ko'plab imkoniyatlar mavjud. Ushbu imkoniyatlar yangi suratlar va yangi nomlarni iloji boricha tezroq shaxsiylashtirish orqali, masalan, kompyuterni ko'rish texnikasidan foydalangan holda sovuq ishga tushirishni boshqarish algoritmlarini ishlab chiqishni o'z ichiga oladi. Boshqa bir imkoniyat bu shaxsiylashtirish yondashuvini biz foydalanadigan san'at asarlarining boshqa turlari va sinopteylar, metadata va treylerlar kabi sarlavhalarimizni tavsiflovchi boshqa dalillarga tarqatishdir. Bundan tashqari, yanada keng tarqalgan muammo mavjud: rassomlar va dizaynerlarga sarlavhani yanada jozibador va shaxsiylashtiradigan qilish uchun to'plamga qanday yangi tasvirlarni qo'shishimiz kerakligini aniqlashda yordam berish.

Agar ushbu muammolar sizni qiziqtirsa, iltimos, bizga xabar bering! Biz doimo jamoamizga qo'shilish uchun ajoyib odamlarni qidirmoqdamiz va ushbu turdagi loyihalar uchun, ayniqsa, mashinalarni o'rganish va / yoki kompyuterni ko'rish tajribasiga ega nomzodlar bizni juda hayajonlantiradi.

Adabiyotlar

[1] L. Li, W Chu, J. Langford va X. Vang, "Internetda qidirish va ma'lumotlarni qidirish bo'yicha ACMning to'rtinchi xalqaro konferentsiyasi materiallari" "Kontekstda banditga asoslangan yangiliklar bo'yicha maqola tavsiyalarining algoritmlarini xolisona baholash". , Nyu-York, Nyu-York, AQSh, 2011 yil, 297-306-betlar.