Fivta'daki yenilikçi atölyeler: FIZTECH'lerin başarısının gerçek hikayeleri. Ben kendim, örneğin, çeşitli taksi hizmetlerini kullanıyorum

Neredeyse bir yıl, sıradışı öğenin FIVTT - yenilikçi atölyede başladığı andan itibaren geçti. Özü, deneyimli mentorların rehberliğinde BT başlangıç \u200b\u200böğrenci ekiplerinin yaratılmasıdır. İyi sonuçlandı: Kurs sayesinde, birisi Crem-Valley'de yazın bir bölümünü geçirdi, biri projenin gelişimi için 800.000 ruble miktarında bir hibe aldı, Abblyy'nin projeyi tam olarak kullanmaya hazır birisi. Ve bu atölyenin tüm sonuçları değil!

2011 yılının başında, FVTT'nin Trekchersnikov montaj salonunda toplandı ve bildirildi: Gelecek yıl boyunca kendi başlangıç \u200b\u200byapmanız gerekecek. Öğrenciler bu fikir kısayolu aldı: Nasıl yapacağımı net değildi ve sorumluluk sıradışıdır - hala bir teknolojik işletme yapmak için hala bir eğitim projesi değildi. Kazanan bu konuda düşünür Öğrenci Olympiad MFTI Fizik, Bölüm Öğrencisi "Yandesca" Victor Kantor:

Aldığımda, FVT'yi seçtim, benzer bir şey olacağını umdum. Bu yüzden boşuna olmadığını umduğuma sevindim. Yıl boyunca, kursun hala kurulu olduğu, birçok yeni şeyin, birçok sorunun sadece öğrenciler için değil, aynı zamanda organizatörler için de tartışmalı olduğu ortaya çıktı, ancak genel olarak, eğilimlerin olumlu olduğunu düşünüyorum. Bu kursu sevdim.

Öğrencilerin çalışmalarını kolaylaştırmak için, yenilikçi işletmeler için fikirlerini öneren çeşitli küratörler davet edildi. Bunların aralarında tamamen farklı insanlardı: Yuri Pavlovich Ammosov'un (O Tüm Kursun Başkanıydı) Yuri Pavlovich Ammosov'un inovasyonlarındaki Ernst & Young Danışmanına Star'shekurov ve MFTI öğrencilerinden Ernst & Young Danışmanı'na ve rejeneratif tıpta bulunan Mikhail batina ve Yaşamın uzatılması sorunları. Sonuç olarak, Fiztech'ler, takımlara eklenen en ilginç fikirleri, küratörleri seçti ve şiddetli, ancak heyecan verici iş başladı.

Neredeyse yıl için, çocuklar bazıları çözmeyi başaran birçok problemle karşılaştı. Artık sonuçlarını tahmin edebilirsiniz - zorluklara rağmen, adamlar başa çıktı. Mfti'nin öğrencileri (FivTO'lara ek olarak, bazı FOPFA öğrencileri ve diğer fakültelere bağlı olarak, oldukça ilginç ve uygulanabilir bir proje hazırlamayı başardı:

Askeroid (önceki ask droid) - akıllı telefonları ara ( Anastasia Uryashev)

Çok sayıda arama motorunu rahatça aramanızı sağlayan Android uygulaması. Bazı uzmanlar kalkınmaya ilgi göstermişlerdir ve Anastasia'nın bir sonucu olarak, geçen yazın tümü Silikon Vadisi'nin en ünlü inkübatörlerinden birinde geçirdi - Tak ve Oyun. Teknolojik girişimcilik temellerini incelemek ve uluslararası girişim uzmanlarıyla konuşmak.

1minute.ru - iyi bir dakika (Lev Moragan)

Bu proje, sadaka olarak meşgul olmak için basit ve tamamen özgür olan herkese mümkün kılar. Model basittir: Reklamverenler sitede bir miktar aktivite sunar, kullanıcılar onlara gönüllü olarak katılıyor, reklamcılıktan gelen tüm para bir yardım kuruluşunda listelenmiştir. Lansmandan bir hafta sonra, proje 6,500'den fazla kullanıcı topladı ve orada durmayacak. Sonuç olarak, Lev ve ekibi sayesinde yetimhaneden 600 çocuk alacak Yeni yıl Santa Claus'tan gelen hediyeler. Zaten iyi bir anlaşma için bir dakika geçirdiniz mi?!

Gömülü Masaüstü - Telefonunuzdaki Bilgisayar (Alexey Vukolov)

Bir durumda birleşmenizi sağlayan bir uygulama. Bilgisayar yetenekleri ve telefon hareketliliği, genellikle iş gezilerinde yoğun insanlar için son derece faydalı bir üründür. Akıllı telefonunuza kurmak yeterlidir ve kullanıcı herhangi bir otelde kendi bilgisayarıyla, ofiste, bir monitörün (TV de uygun), klavye ve fare bulabileceğiniz her yerde "alabilmeyi" yeterli olacaktır. Proje, fikrin gelişimi için bir hibe aldı ve teknoloji fincanı sergisinde sunuldu ve ekip zaten alınan para için ekipmanı aktif olarak satın aldı. Amerikan MIPS işlemcilerinin üreticisi gelişme ile son derece ilgi duyuyor.

Akıllı Tagger - Belgelerde Anlamsal Arama (Victor Kantor)

Posta kutusundaki bir yerde bir yerde, son büyük patlama teorisi serisi hakkında konuşan çok önemli bir mektup koyduğunu, ancak aynı zamanda metinden herhangi bir anahtar kelimeyi hatırlamıyorsunuz? Ara Yandex ve Google güçsüzdür. Smart Tagger, kurtarmaya uygulanacak - anlamsal arama kullanan "Smart" programı, anlamı, popüler TV dizisi ile iç içe geçmiş olan tüm metinleri verecektir. Proje, U.M.N.i.k.'in yarışmasında hibe kazandı. Toplam 400.000 ruble!

Mathok - Formül Tanıma (Victor Pruun)

ABBYY uygulamak için ilginç bir iş sundu - herhangi bir karmaşıklığın matematiksel formüllerini tanıyacak bir program oluşturmak için. FESTTA öğrencileri, fopph'larla işbirliği yapan, görevi yerine getirdi - Modül, Mathan veya Fizikteki ders kitaplarından taranan formülleri gerçekten tanır. Sonuç: ABBYY, büyük para için çok fazla ürün satın almaya hazırdır.

- Bize tamamen ilkel bir örnekte söyleyebilir misiniz, makine öğrenimi nasıl çalışır?

Yapabilmek. En eski şeylerden biri olan "belirleyici ağaç" olarak adlandırılan bir makine öğrenmesi yöntemi örneği var. Şimdi yapalım. Soyut bir kişinin sizi bir tarihte davet ettiğini varsayalım. Senin için önemli olan ne?

- İlk önce biliyorum ya da değil ...

(Victor bunu tahtaya yazar.)

... Eğer bilmiyorsam, soruyu cevaplamanız gerekir, bu, çekici ya da değil.

Ve eğer biliyorsan, önemli değil mi? Görünüşe göre bir Frithsons dalı olduğunu anladım! Genel olarak, bilmiyorsanız ve çekici değilseniz, "Evet Hayır, muhtemelen" cevabı. Eğer biliyorsan, "evet" cevabı.

- Bilsiysem de önemlidir!

Hayır, Fransız şubesi olacak.

Sonra buraya işaret edelim, ilginç ya da değil. Bununla birlikte, bir kişiyi tanımadığınızda, görünüşe olan ilk tepki, arkadaşlarınızla zaten düşündüğü ve nasıl olduğunu düşünüyoruz.

Hadi farklı yapalım. İddialı o ya da değil. Hakem ise, kurtarılması zor olacak, daha fazlasını isteyecek. Ve neospitous acı çekecek.

(Victor, belirleyici ağacı dorishes.)

Hazır. Şimdi tahmin edebilirsiniz, hangi adamla en büyük olasılıkla bir tarihte geleceksiniz. Bu arada, bazı tanışma hizmetleri böyle şeyleri tahmin ediyor. Analoji ile, tahmin edebilir ve kaç ürünün müşterileri satın alacağını ve insanların günün bu döneminde nerede olacağını tahmin edebilirsiniz.

Cevaplar sadece "evet" ve "Hayır" olmayabilir, aynı zamanda sayılar biçiminde de olabilir. Daha doğru bir tahmin istiyorsanız, birkaç tür ağaç yapabilirsiniz ve ortalama olarak ortalaması sağlayabilirsiniz. Ve bu kadar basit şeylerin yardımıyla, geleceği gerçekten tahmin edebilirsiniz.

Ve şimdi hayal edin, iki yüz yıl önce insanlar için böyle bir şema bulmak zor mıydı? Kesinlikle hayır! Bu şema kendi içinde herhangi bir sinsi moloz taşımamaktadır. Bir fenomen olarak, makine öğrenmesi yaklaşık yarım yüzyıl var. Veriler temelinde tahmin, 20. yüzyılın başında bile Ronald Fisher'a başladı. Bu parametrelerin türünü belirlediği bu parametrelere göre, süslüyü ve patlamaların uzunluğu ve genişliği boyunca onları aldı ve dağıttı.

Endüstride, makine öğrenmesi son yılları aktif olarak kullanmaya başladı: büyük miktarda veri işlemek için gereken güçlü ve nispeten ucuz makineler, örneğin, bu tür belirleyici ağaçlar çok uzun zaman önce ortaya çıktı. Ama yine de ruh yakalar: Bu parçaları her görev için çekiyoruz ve yardımlarıyla geleceği tahmin ediyoruz.

- Kesinlikle futbol eşleşmelerinin ahtapotu-taahhütçüsünden daha iyi değil ...

Hayır, iyi, ahtapota kaldığımız yer. Daha fazla değişkenliğimiz olmasına rağmen. Şimdi, makine öğreniminin yardımı ile zaman, para ve yaşam konforunu iyileştirebilirsiniz. Birkaç yıl önce makine eğitimi, görüntülerin sınıflandırılması sorusundaki kişiyi kırdı. Örneğin, bir bilgisayar 20 terrier ırkını tanıyabilir ve ortak bir kişi değil.

- Ve ne zaman kullanıcıları analiz edersiniz, sizin için her insan bir dizidir?

Kabaca konuşurken, evet. Verilerle çalışırken, kullanıcı davranışı dahil tüm nesneler belirli bir sayı kümesini tanımlar. Ve bu sayılar, insanların davranışlarının özelliklerini yansıtıyor: ne sıklıkta bir taksiye gidiyorlar, bir taksi kullanımı, hangi yerler genellikle gidiyor.

Şimdi, benzer davranışa sahip insan gruplarını belirlemek için birbirimize benzer bir model oluşturuyoruz. Yeni bir hizmet tanıttığımızda ya da eski üretmek istediğimizde, ilgilenecek olanlara sunuyoruz.

Örneğin, burada bir servisimiz var - bir takside iki çocuk koltuğu. Bu haberi öğrenebiliriz ve sadece belirli bir insan çemberini ele alabiliriz. Yıl için, iki çocuğun sandalyesine ihtiyaç duydukları yorumlarda yazan bazı kullanıcıları biriktirdiler. Onları bulduk ve onlara benziyoruz. Koşullu olarak, bunlar düzenli olarak seyahat eden ve Akdeniz mutfağını seven 30 yıldır insanlardır. Tabii ki, işaretler çok daha fazlası olsa da, örneğin.

- Bu tür incelikler bile?

Bu basit bir meseledir. Her şey arama sorguları kullanılarak hesaplanır.

Ve uygulamada bir şekilde işe yarayabilir mi? Örneğin, bir dilencim olduğumu ve "ayda 500 ruble hayatta kalır" gibi gruplar için imzaladığımı biliyorsunuz - sadece Ucuz Ucuz Otomobiller, Spacex Haberlerine abone oldu - ve zaman zaman zamanım var mı?

Öyle çalışabilir, ancak Yandex'te böyle şeyler onaylanmadı, çünkü ayrımcılık. Hizmeti kişiselleştirdiğinizde, en uygun olanı değil, en iyisini ve bir kişinin neyi sevdiğini sunmak daha iyidir. Ve mantığın dağılımı "Bu daha iyi bir makine gerektirir ve bu daha az iyidir" - kötülük.

Herkesin çarpıcı arzuları vardır ve bazen Akdeniz olmayan bir yemek tarifi bulmanız gerekir, ancak örneğin, Coproophilia hakkındaki resimler. Kişiselleştirme ve bu durumda işe yarayacak mı?

Her zaman özel bir mod vardır.

Birinin ilgi alanlarımı bilmesini istemiyorsam ya da söyleyelim, arkadaşlar bana geldi ve bazı çöpleri görmek istedim, gizli bir rejimin kullanılması daha iyidir.

Hala hangi şirketin kullanacağına, örneğin yandex veya google'a karar verebilirsiniz.

- Bir fark var mı?

Zor soru. Başkalarının, ancak Yandex'te, kişisel verilerin korunmasıyla zor olduğunu bilmiyorum. Özellikle personeli kontrol eder.

- Bu, bir erkekten ayrılırsam, bu yazlığa gitip gitmediğini öğrenemiyorum.

Yandex'te çalışsanız bile. Bu, elbette üzgün, ama evet, bulmak mümkün olmayacak. Çalışanın çoğu bu verilere erişimi bile yok. Her şey şifreli. Her şey basit: İnsanlar için casusluk yapamazsınız, bu kişisel bir bilgidir.

Bu arada, erkeklerle ayrılma konusundaki ilginç bir dava vardı. "B" noktasının tahminini yaptığımızda - bir taksideki hedef noktalar, ipuçlarını tanıttı. Bak.

(Victor, "Yandex.taxi" uygulamasına girer.)

Örneğin, bir taksi evde olduğumu düşünüyor. Beni işe ya da rudn'e gitmemeyi davet ediyor (orada makine eğitim kursu veri madenciliği çerçevesinde dersleri okudum). Ve bir noktada, bu istemlerde çalışmak, kullanıcıyı ödün vermemeniz gerektiğini fark ettik. "B" noktalarını görebilir. Bu nedenlerden dolayı, benzemek için yerler sunmayı reddettik. Ve sonra iyi insanlarla iyi bir yerde oturuyorsunuz, bir taksi sipariş ettiniz ve size yazıyorlar: "Bak, bu barda olmadın!"

- Haritada ne tür mavi noktalar yanıp sönüyor?

Bu toplama noktalarıdır. Bu noktalar, bir taksi aramak için çok daha uygun. Ne de olsa, aramada tamamen uygunsuz olacağı böyle bir yerde arayabilirsiniz. Ancak genel olarak, herhangi bir yeri arayabilirsiniz.

- Evet, Bir şekilde iki çeyrek için bununla uçtum.

İÇİNDE son zamanlarda GPS ile farklı zorluklar vardı, farklı eğlenceli durumlara yol açtı. İnsanlar, örneğin, Tverskaya'da, yoluyla gezinti Pasifik Okyanusu. Gördüğünüz gibi, bazen özlüyor ve daha fazla iki çeyrek var.

- Uygulamayı yeniden başlatırsanız ve tekrar dürtünse, fiyat birkaç ruble değişir. Neden?

Talep teklifi aşarsa, algoritma otomatik olarak katsayısında bir artış oluşturur - taksinin, yüksek talep dönemlerinde bile mümkün olduğunca mümkün olduğunca önemli olanlara yararlanmaya yardımcı olur. Bu arada, makine öğrenmesinin kullanılması, örneğin bir saat boyunca daha fazla talep olacağı tahmin edilebilir. Teklifin talebe karşılık geldiği için daha fazla emir olacağı sürücüleri önermemize yardımcı olur.

- "Yandex.taxi" nin yakında taksi pazarını öldüreceğini sanmıyorum?

Bence hayır. Sağlıklı rekabet içiniz ve ondan korkmuyoruz.

Ben kendim, örneğin, farklı taksi hizmetleri kullanıyorum. Zaman beklemek benim için önemlidir, bu yüzden birkaç uygulamaya bakıyorum, bir taksi daha hızlı gelecek.

- Uber ile birleştirdin. Ne için?

Yetkinlik yorumumda değil. Birleşmeyi düşünüyorum, derin makul bir çözümdür.

Almanya'da, bir adam dronda bir banyo kurdu ve burgerun arkasında uçtu. Hava sahasını ustalaşmanın zamanı geldiğini düşündün mü?

Hava sahası hakkında bilmiyorum. Ruhundaki haberler için "Uber," takip ediyoruz "teknelerde bir taksi başlattı, ama hava hakkında hiçbir şey söyleyemem.

- ve drone taksi?

İşte ilginç bir an. Onları geliştiriyoruz, ancak onları nasıl kullanmanız gerektiğini düşünmelisin. Hangi formda ve sokaklarda ortaya çıktıklarında tahmin yapmak için hala erkendir, ancak sürücünün sürücünün bir sürücüye ihtiyaç duymadığı tamamen özerk bir araba için teknoloji geliştirmek için her şeyi yaparız.

- Arabayı uzaktan yönetmek için dronlardan hacklemeye yönlendiren endişeler var mı?

Teknolojilerin ve aletlerin olduğu her zaman riskler ve her yerde. Ancak teknolojilerin gelişimi ile birlikte, başka bir yön gelişmektedir - korumaları ve güvenliği. Bir şekilde teknolojilerin gelişimi ile uğraşan herkes, koruma sistemleri üzerinde çalışmak.

- Kullanıcılar hakkında hangi verileri toplarsınız ve bunları nasıl savunursunuz?

Örneğin, seyahatin nerede, ne zaman ve nerede yapıldığını, kullanım ökheri olmayan verilerini topluyoruz. Hepsi önemli - biz yaşıyoruz.

- Dronlar yüzünden, iş sayısının azalması mı düşünüyorsunuz?

Bence sadece daha fazla olacak. Ancak bu uçaklar da bir şekilde hizmet verilmelidir. Bu, elbette, biraz stresli durum, özelliği değiştir, ama ne yapmalı.

- Her konferansta Greef, bir kişinin mesleğini en az üç kez radikal bir şekilde değiştireceğini söylüyor.

Yüzyıllar için bazı uzmanlıklar diyemiyorum. Geliştirici, tüm hayatını aynı dilde ve aynı teknolojilerde çalışmaz. Yeniden inşa etmeniz gereken her yer. Makine öğrenmesiyle, benden altı yaşında genç olan adamlar, benden çok daha hızlı düşünüyorum. Aynı zamanda, 40 ya da 45 yıldaki insanlar daha da güçlendiğini hissediyor.

- Deneyim artık bir rol oynamıyor mu?

Oynar. Ancak, yöntemler değişir, örneğin, derin eğitimin kullanılmadığı bölgeye gelebilir, bir süredir orada çalışan, o zaman derin eğitim yöntemleri her yerde tanıtılmaktadır ve içinde hiçbir şey anlamadınız. Ve bu kadar. Deneyiminiz, yalnızca takımın çalışmalarını planlama konusunda faydalı olabilir ve her zaman değildir.

- Ve mesleğin - veri bilimcisi.Talepte mi?

Veri bilimi alanında, talep basitçe sarsıldı. Açıkçası, şimdi deli khaip dönemi. Tanrıya şükür, Blockchain bu Haip'in kaydetmesine yardımcı oldu. Blockchain'deki uzmanlar hala söküyor.

Ancak birçok şirket şimdi makine öğrenmeye para koyarlarsa, hemen bahçeleri çiçek açacaklar. Bu doğru değil. Makine öğrenmesi belirli görevleri çözmelidir ve sadece mevcut değildir.

Bir bankanın kullanıcılar için bir öneri sistemi yapmak istediğinde davalar var. Söyledik: "Ekonomik olarak haklı çıkacağını düşünüyor musunuz?" Cevap: "Evet, biz inciriz. Yapmak. Aynı öneri sistemlerinin tümü, eğilimde olacağız. "

Acı, iş için gerçekten yararlı olan şey bir günde yapılamaz. Sistemin nasıl eğitileceğini izlemeniz gerekir. Ve her zaman başında hatalarla çalışır, öğrenirken bazı verilere sahip olmayabilir. Hataları düzeltin, sonra tekrar düzeltin ve hatta her şeyi tekrarlayın. Bundan sonra, sistemin üretimde çalışması için istikrarlı ve ölçeklenebilir olması için yapılandırmanız gerekir, bu başka bir zaman. Sonuç olarak, bir proje yarım yıl, bir yıl ve daha fazlası alır.

Makine öğrenme yöntemlerine kara kutu olarak bakarsanız, saçmalıkların nasıl gerçekleştiğini kolayca atlayabilirsiniz. Sakallı bir hikaye var. Asker, analiz edilebileceği bir algoritma geliştirmeyi istedi, resimde bir tank var ya da değil. Araştırmacıların test edilmesi, kalitesi mükemmel, her şey harika, orduya verdi. Askeri ve hiçbir şeyin işe yaramadığını söylüyor. Bilim adamları endişeyle anlamaya başlarlar. Tüm resimlerde, askeri tarafından getirilen tankla olan tüm resimlerde, tutamağın köşesinde bir onay işareti yapıştırılmıştır. Algoritma kusursuz bir şekilde bir kene bulmayı öğrendi, tank hakkında hiçbir şey bilmiyordu. Doğal olarak, yeni resimlerde bir kene yoktu.

Diyalog sistemlerini geliştiren çocuklarla tanıştım. Zaten çocuklu çocuklarla işbirliği yapmaları gerektiğini düşünmedin mi?

Schoolchildren için her türlü etkinlik için uzun zamandır sürüyordum, makine öğrenimi hakkında dersleri okudum. Ve bu arada, bunlardan biri bana bir tonu-greyder anlatmayı öğretti. Hikayemin iyi ve ilginç olacağından kesinlikle emindim, gururlu olacağından, yayınlanmaya başladı ve kız şudur: "Ve bu şeyi en aza indirmek istiyoruz." Bak ve düşünüyorum, ama gerçekten, neden ve gerçeği en aza indirgenebilir ve burada ispatlamak için kanıtlayacak bir şey yok. Birkaç yıldır zaten geçti, şimdi "FIZTECH" öğrencisi olarak derslerimiz. Yandex, bu arada, Schoolchildren'in ücretsiz programlama bilgisini alabileceği Yandex.lith, yandex.lith.

- Şu anda öğrettikleri üniversitelere ve fakültelere tavsiyede bulunun makine öğrenme.

MIP, FIVT ve FPAM fakülteleri var. "Kule" bile, Moskova Devlet Üniversitesi'nde ICD'deki Moskova Devlet Üniversitesi'nde harika bir bilgisayar bilimleri fakültesi var. Peki ve şimdi rudn'deki kursunuzu dinleyebilirsiniz.

Dediğim gibi, bu meslek talep ediyor. Çok uzun, teknik eğitim alan insanlar tamamen farklı işlerle uğraştı. Makine eğitimi harika bir örnek, insanların öğrendiği her şey teknik EğitimŞimdi onlar sadece gerekli, faydalı ve iyi ödenmiş.

- Ne kadar iyi?

Miktarı adlandırın.

- Ayda 500 bin.

Sıradan veri bilimcisi olmayabilirsin. Ancak bazı şirketlerde, oldukça stajyer binlerce 50'nin basit çalışması için alabilir. Çok büyük bir dağılım var. Genel olarak, dik veri bilimci maaşı, bazı orta şiddetteki maaş genel müdürü ile karşılaştırılabilir. Birçok şirkette, maaşın yanı sıra, çalışan için hala birçok çörek var ve eğer kişinin devam etmek için devam etmek için iyi bir marka gelmediği görülebiliyorsa, ama bu gerçekten iyi olacak.

ABC ABC projesinin ortaklaşa bir parçası olarak, Darwinian evriminin ilkeleri ve yasaları üzerine "büyümebilmenizi" sağlayan sözde programlar hakkında zaten yazdık. Ancak, şu ana kadar yapay zekaya olan bu yaklaşım kesinlikle "geleceklerden konuk". Ancak sistem olarak yapay zeka Bugün yarat Nasıl öğretiliyorlar? Bu, bir Kullanıcı Davranışı Analizi Ekibi Müdürü Viktor Kantor, Algoritmalar Bölümü ve IPTI Programlama Teknolojileri Kıdemli Öğretmeni tarafından yardımcı oldu. Yandex verileri. Fabrika.

"Vade Teknolojileri Döngüsü" olarak düzenli olarak güncelleyen Araştırma Şirketi Gartner raporuna göre, bugün tüm bunlardan beklentilerin zirvesinde tam olarak makine öğrenmesidir. Şaşırtıcı değil: Son birkaç yılda, makine öğrenmesi, algoritmalar teorisindeki dar çemberinin ve uzmanların dar çemberinin çıkarlarından çıkmış ve ilk önce bir işadamının bir sözlüğüne ve sonra dünyaya girmiştir. sıradan insanların. Şimdi, özel "sihirli" nöral bir ağ olarak böyle bir şey var, Prisma uygulamasını kullanan, Shazam ile şarkı arayan ya da DeigRdream'tan geçirilen görüntüleri gören herkesi bilir.

Ancak, bir şey teknolojiyi kullanmak, diğeri nasıl çalıştığını anlamaktır. "Bilgisayar, bir ipucu verirse öğrenebilir" veya "NureReta dijital nöronlardan oluşur ve insan beyni gibi düzenlenmiş" gibi ortak kelimeler, birileri de yardımcı olabilir, ancak daha sık durumu sadece şaşırtabilir. Popüler metinlere ciddi şekilde meşgul edecek olan aynı olanlar gerekli değildir: ders kitapları ve onlar için mükemmel çevrimiçi kurslar var. Orta yoldan geçmeye çalışacağız: En basit görevde gerçekte nasıl öğrendiğinizi açıklamak ve daha sonra gerçek ilginç sorunları çözmek için aynı yaklaşımın nasıl uygulanabileceğini göstermek için.

Araba nasıl öğrenilir

Başlamak için, makine öğreniminin nasıl gerçekleştiğiyle uğraşmak için, kavramlarla tanımlayacağız. Bu alanın öncülerinden birini tanımlayarak, Arthur Samuel, makine öğrenmesi, "bilgisayarların doğrudan programlama olmadan öğrenmelerine izin vermesi" yöntemlerini içerir. İki kapsamlı makine öğrenme yöntemi sınıfı vardır: öğretmen olmadan bir öğretmen ve eğitim eğitimi. Birincisi, örneğin, örneğin, sığırların görüntüsüyle, ikincisi olan fotoğrafları aramak için bir bilgisayarı öğretmeniz gerekir - örneğin, arabayı yapmamız gerektiğinde, örneğin, arazilerde bağımsız olarak gruplayabilir. Yandex.news veya Google Haberleri gibi hizmetlerde olur. Yani, ilk durumda, doğru cevabın varlığını (fotoğraftaki bir kedinin), ikincisinde, ikincisinde, yalnızca doğru cevap yoktur ve orada bulunmayan bir görevle uğraşıyoruz. farklı yöntemler Görev çözümleri. İlk görev sınıfına en ilginç olarak odaklanacağız.

Öyleyse, bazı tahminler yapacak bir bilgisayarı öğretmemiz gerekiyor. Dahası, daha doğru olarak arzu edilir. Tahminler iki türden olabilir: Ya birkaç cevap arasında seçim yapmanız gerekir (bir anlık görüntüde bir kedi var veya değil - bu iki bir sürümün seçimi, görüntülerdeki harfleri tanımlama yeteneği bir seçeneğin seçimidir. birkaç ona kadar vb.) veya sayısal bir tahmin oluşturun. Örneğin, bir kişinin ağırlığını büyümesi, yaşı, ayakkabıların büyüklüğüne göre tahmin etmek, vb. Bu görevlerin iki türü sadece aksine, neredeyse eşit olarak çözülürler. Tam olarak nasıl anlamaya çalışalım.

Tahmin sistemini yapmamız gereken ilk şey, sözde öğrenme örneğini, yani popülasyondaki insanların ağırlığındaki verileri toplamaktır. İkincisi, ağırlık hakkında sonuç çıkarabileceğimiz işaretler kümesine karar vermektir. En "güçlü" işaretlerden birinin insan büyümesi olacağı açıktır, bu yüzden ilk yaklaşımda sadece onu almak yeterlidir. Ağırlık, büyümeye doğrusal olarak değişirse, tahminimiz çok basit olacaktır: Bir kişinin ağırlığı, bir tür katsayılı olarak çarpılan büyümesine eşit olacaktır, artı en basit formülünün yazdığı bir tür sabit değer. \u003d KX + b. Tek yapmamız gereken, arabaya bir kişinin ağırlığını tahmin etmesini öğretmek, bir şekilde K ve B'nin doğru değerlerini bulur.

Makine öğreniminin cazibesi, çalıştığımız bağımlılık, çok karmaşık olsa bile, yaklaşımımızda neredeyse hiçbir şey değişmeyecek. Aynı regresyonla başa çıkmaya devam edeceğiz.

Büyümesinin insan ağırlığında doğrusal olmayan olmadığını ve üçüncü derecede (aslında beklenen, çünkü ağırlık vücudun hacmine bağlıdır). Bu bağımlılığı dikkate almak için, sadece kendi katsayısı ile üçüncü büyüme derecesine, yani kendi katsayısıyla, y \u003d K 1 x + K 2 x 3 + B'dir. Şimdi, arabayı eğitmek için iki, ancak üç miktar (Kı, K2 ve B) bulmamız gerekecek. Tahmin bakımımızda, kişinin ayakkabılarının büyüklüğünü, yaşını, TV ile geçirilen zamanı ve dairesinden en yakın hızlı fud noktasına olan mesafeyi düşündüğümüzü varsayalım. Hiçbir sorun yok: Bu işaretleri aynı denklemde ayrı üyeler olarak yaparız.

En önemli şey, istenen katsayıları bulmak için evrensel bir yol oluşturmaktır (Kı, K2, ... K N). Eğer öyleyse, tahmin etmek için işaretlerin kullanılması neredeyse kayıtsız olacaktır, çünkü arabanın kendisi büyük bir ağırlık önemli ve küçük önemsiz işaretler eklemeyi öğretecek. Neyse ki, bu yöntem zaten icat edildi ve neredeyse tüm makine öğrenimi başarıyla çalışıyor: En basit doğrusal modellerden kişi ve konuşma analizörlerinin tanıma sistemlerine kadar. Bu yöntemin degrade iniş denir. Ancak nasıl çalıştığını açıklamadan önce, biraz geri çekilmek ve sinir ağını anlatmak gerekir.

Nöraseti.

2016 yılında, nöral ağ, herhangi bir makine öğrenmesi ile neredeyse tanımlandıkları ve hiç gelişmiş oldukları bilgi gündemine çok sıkı bir şekilde dahil edildi. Resmi olarak konuşursak, yanlıştır: Vintage'deki sinir ağları her zaman kullanılmaz, başka teknolojiler de vardır. Ancak, genel olarak, elbette, böyle bir dernek anlaşılabilirdir, çünkü kesinlikle nöral ağlara dayanan sistemdir, şimdi en "büyülü" sonuçları, fotoğraf tarafından bir kişiyi, tarzını taşıyan uygulamaların görünümü gibi en fazla "büyülü" sonuçları verir. belirli bir kişinin konuşma biçiminde diğerine bir görüntü veya sistem oluşturma sistemleri.

Yol nörosetikler için düzenlenmiştir, biz zaten. Burada, sinir ağının diğer makine öğrenme sistemlerine kıyasla gücünün çok katmanlı olduğuna karar verdiğini vurgulamak istiyorum, ancak bu onları işyeriyle temel olarak mükemmel bir şey yapmaz. Çok katmanlı, resimdeki pikseller gibi karmaşık işaretlerdeki çok soyut ortak özellikleri ve bağımlılıkları bulmanızı sağlar. Ancak, nörallet öğrenme ilkelerinin bakış açısının bakış açısına göre, hiçbir şeyin konvansiyonel doğrusal regresyon formüllerinden radikal bir şekilde farklı olmadığını anlamak önemlidir, bu nedenle aynı derecede gradyan iniş yöntemi burada mükemmel çalışır.

Sinir ağının "gücü", haddelenmiş bir orta nöron tabakasının varlığında olup, bu da özetlenen giriş katmanı değerlerini birleştirir. Bu nöralo nedeniyle, doğrusal veya ikinci dereceden bir bağımlılık gibi basit formülleri azaltmak zor olan verilerin çok soyut özellikleri olabilir.

Örneği açıklayalım. İnsan ağırlığının Küba'daki büyümesine ve büyümesine bağlı olduğu tahminlerde durduk, bu formül Y \u003d K1 x + K 2 x 3 + B ile ifade edilir. Bazı gerginlikle, ancak aslında, böyle bir formül bile sinir ağı olarak adlandırılabilir. Bunda, her zamanki sinir ağında olduğu gibi, "nöronların" ilk katmanı var, bu bir işaret katmanıdır: bu, x ve x 3 (iyi, "tek nöron", akılda tuttuğumuz ve b) katsayısına. Üst veya sonuçta, katman, bir "nöron" y, yani, insanın öngörülen ağırlığı ile temsil edilir. Ve "nöronlar" nın birinci ve son katmanı arasında, güç veya ağırlık, Kı-K2 ve B katsayıları ile belirlenen bağlantılar var. Bu "nörallet" öğretmek için bu çok katsayıları bulmak anlamına gelir.

Buradaki "gerçek" sinir ağlarından tek fark, görevi olan giriş işaretlerini birleştirmek olan bir ara (veya gizli) nöron katmanımız olmamasıdır. Bu tür katmanların tanıtılması, mevcut belirtiler arasındaki olası bağımlılıkları "başın dışında" olası bağımlılıklar, ancak nöral ağdaki mevcut kombinasyonlarına güvenmemesini sağlar. Örneğin, TV'nin önündeki yaş ve ortalama süre insan ağırlığı üzerinde sinerjistik bir etkiye sahip olabilir, ancak sinir ağına sahip olmak, önceden bilmek ve işlerini formülde yapmak zorunda değiliz. Nörosette, herhangi bir iki işaretin etkisini birleştiren nöron olacak ve bu etki numunede gerçekten farkedilirse, eğitimden sonra bu nöron otomatik olarak çok fazla kilo alacaktır.

Dereceli alçalma

Öyleyse, bilinen verilerin, yani, bir kişinin tam olarak ölçülmüş ağırlığına sahip bir tablo ve bazı hipotez bağımlılığına sahip bir tabloda bir öğrenme örneğine sahibiz. bu durum doğrusal regresyon y \u003d kx + b. Görevimiz, K ve B'nin doğru değerlerini, manuel olarak değil, otomatik olarak bulmaktır. Ve tercihen, formüle dahil olan parametrelerin sayısına bağlı olmayan bir evrensel yöntem.

Genel olarak, kolay. Ana fikir, mevcut toplam hatayı ölçecek ve katsayıları "bükün", böylece toplam hata seviyesinin yavaş yavaş düşmesi için belirli bir işlevi oluşturmaktır. Bir hata seviyesi nasıl düşüyor? Parametrelerimizi istenen tarafa çevirmeniz gerekir.

Aynı K ve B'yi, kuzey-güney eksenleri ve batı-doğu gibi, aynı K ve B'yi aradığımız parametrelerimizi sunuyoruz. Böyle bir uçağın üzerindeki her nokta, belirli bir katsayının, yükselen ve ağırlık arasındaki belirli bir ilişkinin değerine karşılık gelecektir. Ve uçaktaki her bir nokta için, numunemizdeki örneklerin her birinde bir tahmin veren toplam hata seviyesini hesaplamak mümkündür.

Uçakta belirli bir yükseklik gibi bir şey ortaya çıkar ve çevresindeki tüm alan bir dağ manzarasına benzemeye başlar. Dağlar, hataların seviyesinin çok yüksek olduğu noktalardır, vadiler daha az hatanın olduğu yerlerdir. Sistemimize öğretmenin, yerde en düşük noktayı bulmak anlamına geldiği açıktır, hata seviyesinin minimum olduğu nokta.

Bu noktayı nasıl bulabilirim? En doğru yol, başlangıçta kendilerini bulduğumuz noktadan aşağı doğru hareket etmektir. Çok erken veya daha sonra yerel minimuma geleceğiz - altındaki mahallede hiçbir şey yok. Dahası, farklı boyutlarda adımlar atmanız önerilir: eğim soğutulduğunda, eğim küçük olduğunda daha geniş yürüyebilirsiniz, daha sonra yerel minimumun "Tipteo'da" gizlice girmek daha iyidir, aksi takdirde de kaydırabilirsiniz.

Bu, gradyan iniş yöntemi nasıl çalışır: İşaretlerin ağırlıklarını hata fonksiyonundaki en büyük düşüş yönünde değiştiririz. Yıldırımlarını değiştiririz, yani, değeri eğimin eğimiyle orantılı olan belirli bir adımla birliktedir. İlginç olan, işaret sayısında bir artışla (bir kişinin büyüme küpünü, yaşını, ayakkabıların büyüklüğünü ekleme, vb.) Aslında, hiçbir şey değişmez, sadece manzaramız iki boyutlu değil, çok boyutlu olmaz.

Hata işlevi, mevcut formülün, ağırlığı bizim için zaten bilinen insanlara göre kabul ettiği tüm sapmaların karelerinin toplamı olarak tanımlanabilir. Al biraz rastgele değişkenler K ve B, örneğin 0 ve 50 için. Daha sonra sistem, numunedeki her kişinin ağırlığının her zaman 50 kilograma eşit olduğunu, grafikte her zaman 50 kilograma eşit olduğunu, bu bağımlılık düz bir şekilde görüneceğini öngörür. paralel yatay. Bunun iyi bir tahmin olmadığı açıktır. Şimdi, bu öngörülen değerin ağırlığında bir sapma yapıyoruz, kareye dikin (yani negatif değerler de dikkate alınır) ve özetleyin - bu noktada bir hata olacaktır. Analizin başlangıcına aşinassanız, en büyük düşüşün yönünün, hata fonksiyonunun K ve B tarafından özel türevi tarafından verildiğini açıklığa kavuşturabilir ve adım, pratik hususlardan seçilen değerdir: küçük Basamaklar hesaplamalarda çok fazla zaman işgal ediyor ve büyük, en azından geçtiğimiz gerçeğine yol açabilir.

Peki ve eğer sadece çok fazla işaret ile karmaşık bir regresyon değilsek, ama gerçek bir sinir ağı? Bu durumda gradyan inişi nasıl uyguluyoruz? Sinir şebekesi, gradyan inişle aynı şekilde çalışır, sadece eğitimde, katmandan katmana ve 2) aşamalarda, tabakadan katmana ve 2) kademeli olarak, örneğindeki bir örnekten diğerine geçer. Burada uygulanan yöntem, tersi algoritma olarak adlandırılır, 1974'te Sovyet Matematik Alexander Galushkina ve Harvard Üniversitesi Paul John Webros'dan Matematik tarafından bağımsız olarak açıklanmıştır.

Algoritmanın sıkı bir şekilde sunulması için, özel türevlerden (örneğin, örneğin,), sezgisel düzeyde her şeyin oldukça basit olduğu için gerekli olacaktır: Numunedeki her örnek için, üretiminde bazı tahminlerimiz var. sinir ağı. Doğru cevabı olan, doğru cevabı tahminden çıkarabiliriz ve böylece bir hata (her bir çıktı katmanı nöron için daha kesin bir hata). Şimdi bu hatayı önceki nöron katmanına aktarmamız gerekiyor ve bu katmanın bu beton nöronunun daha büyük olması Hata'ya katkıda bulundu, kilonuzu azaltmak için daha fazla ihtiyacımız var (aslında, konuşmayı tekrar özel bir türev almaya geliyor, hayali peyzajımızın maksimum dikliğindeki hareket hakkında). Yaptığımızda, aynı prosedür bir sonraki katman için tekrarlanmalı, ters yönde hareket edilmeli, yani sinir ağının çıkışından girişe.

Böylece, bu nedenle, her bir eğitim örneğinin her örneğinde ve nöronların ağırlıklarını doğru yönde "bükülme" nörallet, nihayetinde sinirsel olarak eğitilmek zorundayız. Ters hata dağıtım yöntemi, çok katmanlı sinir ağları için degrade iniş yönteminin basit bir modifikasyonudur ve bu nedenle herhangi bir karmaşıklığın sinir ağları için çalışmalıdır. Burada "gerekir" diyoruz, çünkü aslında degrade inişin başarısızlık verdiği ve iyi bir regresyon yapmanıza ya da nörallet öğretmenize izin vermemenizi amaçlayan davalar var. Bu tür zorlukların ortaya çıkması hakkında, bilmek faydalıdır.

Degrade iniş zorlukları

Yanlış bir minimumun yanlış seçimi. Degrade iniş yöntemi, yerel ekstremyum aramaya yardımcı olur. Ama biz her zaman onunla değiliz, mutlak bir küresel minimum veya maksimum işlev elde edebiliriz. Bunun nedeni, bir agadiment üzerinde hareket ederken, şu anda bizi karşılayan ilk yerel minimuma ulaştığımız anda dururuz ve algoritma çalışmalarını durdurur.

Dağın tepesinde durduğunuzu hayal edin. İlçedeki en düşük yüzeye gitmek istiyorsanız, gradyan iniş yöntemi her zaman size yardımcı olmayacaktır, çünkü yolunuzdaki ilk lowline mutlaka en düşük nokta olmayacaktır. Ve eğer hayatta küçük bir tırmanış olduğunu görebiliyorsanız ve daha sonra daha düşük düşebilirsiniz, o zaman böyle bir durumda algoritma durur. Genellikle, doğru adımı seçerseniz bu durumdan kaçınılabilir.

Yanlış adımlar. Degrade iniş yöntemi, yinelemeli yöntemdir. Yani, biz kendimizin adım adımını seçmemiz gerekiyor - inişlediğimiz hız. Çok fazla adım seçerek, ihtiyacımız olan extremum tarafından uçabiliriz ve minimum bulamayız. Bu, kendinizi çok keskin bir inişin önünde bulursanız olabilir. Ve çok az adım seçimi, kendimizi nispeten pürüzsüz bir yüzeye bulursak, algoritmanın son derece yavaş çalışmasını tehdit ediyor. Yine Sırf Dağın tepesinde olduğumuzu hayal ederseniz, çok havalı bir iniş yüzünden bir durum olabilir, sadece koyduk.

Ağ felci.Bazen degrade iniş yöntemi bir minimum bulmayı başaramadığıdır. Bu, iki taraftan minimumdan bir minimumdan oluşursa, pürüzsüz alanlar olacaktır - algoritma, düz arsa çarpan, adımları azaltır ve zaman içinde durur. Dağın tepesinde durursa, ovada evinize taşınmaya karar verirseniz, yanlışlıkla çok pürüzsüz bir alana sahipseniz, yol çok uzun olabilir. Veya, pratik olarak "yamaçlar" varsa, algoritma, çok büyük bir adım seçerek, bir eğimden diğerine, neredeyse minimumdan geçmeden atlayacaktır.

Makine öğrenme sistemi tasarlarken tüm bu zor anlar dikkate alınmalıdır. Örneğin, zaman içindeki hata işlevini tam olarak nasıl değiştirdiğini tam olarak izlemek faydalıdır - bu sonbaharın karakteri, adım değerindeki değişime bağlı olarak değiştiğinden, her yeni bir döngü veya ezici ile düştüğünde olup olmadığı. Kötü bir yerel asgari hale gelmekten kaçınmak için, manzaranın farklı rastgele seçilen noktalarından başlamak faydalıdır - o zaman sıkışıp kalma olasılığı çok daha düşüktür. Degrade inişli hala çok büyük ve küçük dolaşım sırları vardır, degrade inişe kadar zayıf, daha egzotik öğrenme yolları vardır. Bununla birlikte, bu zaten bir başka konuşmanın konusu ve ABC ABC Projesi çerçevesinde ayrı bir makalenin konusudur.

Hazırlanan Alexander Erschov