Машина үйрөнүү

Википедия дан

Машина үйрөнүү (англ. machine learning, ML) – жасалма интеллект методдорунун классы, анын мүнөздүү өзгөчөлүгү көйгөйдү түз чечүү эмес, бирок ушул сыяктуу көптөгөн маселелерди чечүү жолдорун колдонуу аркылуу үйрөнүү. Мындай ыкмаларды куруу үчүн математикалык статистиканын инструменттери, сандык методдор, математикалык анализ, оптималдаштыруу методдору, ыктымалдуулук теориясы, график теориясы жана цифралык формадагы маалыматтар менен иштөөнүн ар кандай ыкмалары колдонулат.

Тренингдин эки түрү бар:

  1. Прецеденттик окутуу, же болбосо индуктивдүү окутуу, аныктоого негизделген эмпирикалык мыйзам ченемдүүлүктөрү - жылы маалыматтар.
  2. Дедуктивдүү окутуу эксперттердин билимин формалдаштырууну жана аларды компьютерге билим базалары.

Дедуктивдүү окутуу доменге таандык эксперттик системалар. ошондуктан терминдер машинаны үйрөнүү жана прецеденттик окутуу синонимдер деп эсептесе болот.

Классикалык статистикалык ыкмаларга альтернатива катары көптөгөн индуктивдүү окутуу ыкмалары иштелип чыккан. Көптөгөн ыкмалар маалымат алуу менен тыгыз байланышта (англ. information extraction, маалымат издөө ), маалыматтарды казып алуу .

Жана башка дагы[түзөтүү | булагын түзөтүү]

Көптөгөн объекттер (ситуациялар) жана көптөгөн мүмкүн болгон жооптор (жооптор, реакциялар) бар. Жооптор менен объекттердин ортосунда кандайдыр бир көз карандылык бар, бирок ал белгисиз. Прецеденттердин чектүү жыйындысы гана белгилүү - "объект, жооп" жуптары, окутуу топтому деп аталат. Бул маалыматтардын негизинде жашыруун көз карандылыкты калыбына келтирүү, башкача айтканда, ар кандай мүмкүн болгон киргизүү объектисине жетиштүү так классификациялык жоопту чыгарууга жөндөмдүү алгоритмди куруу зарыл. Бул көз карандылык сөзсүз түрдө аналитикалык түрдө туюндурулбайт жана бул жерде нейрон тармактары эмпирикалык түрдө түзүлгөн чечим принцибин ишке ашырат. Бул учурда маанилүү өзгөчөлүк болуп окутуу системасынын жалпылоо, башкача айтканда, учурдагы окутуу үлгүсүнүн чегинен чыккан маалыматтарга адекваттуу жооп берүү жөндөмдүүлүгү саналат. Жооптордун тактыгын өлчөө үчүн сапатты баалоо функциясы киргизилет.

Бул билдирүү классикалык маселелерди жалпылоо болуп саналат жакындаштыруу милдеттери. Классикалык жакындоо маселелеринде объектилер чыныгы сандар же векторлор болуп саналат. Чыныгы тиркемелерде объектилер жөнүндө маалыматтар толук эмес, так эмес, сандык эмес, гетерогендүү болушу мүмкүн. Бул өзгөчөлүктөр машинаны үйрөнүү методдорунун ар түрдүүлүгүнө алып келет.

Машина үйрөнүү ыкмалары[түзөтүү | булагын түзөтүү]

Машина үйрөнүү бөлүмү, бир жагынан, нейрондук тармактар илиминин тармактарды окутуу ыкмаларына жана алардын архитектурасынын топологияларынын түрлөрүнө бөлүнүүнүн натыйжасында түзүлсө, экинчи жагынан математикалык статистиканын ыкмаларын камтыган [lower-alpha 1] . Төмөндө саналып өткөн машинаны үйрөнүү ыкмалары нейрондук тармактарды колдонууга негизделген, бирок окутуу топтомуна негизделген башка методдор бар – мисалы, байкалган статистиканын жалпыланган дисперсиясы жана ковариациясы боюнча иштеген дискриминанттык анализ же Байес классификаторлору. Нейрондук тармактардын негизги типтери, мисалы, перцептрон жана көп катмарлуу перцептрон (ошондой эле алардын модификациялары) күчөтүлгөн жана өзүн-өзү уюштуруу менен окутуучу менен да, окутуучусуз да үйрөтүлүшү мүмкүн. Бирок кээ бир нейрон тармактары жана көпчүлүк статистикалык ыкмалар окутуу ыкмаларынын бирине гана таандык болушу мүмкүн. Ошондуктан, эгер сиз окутуу ыкмасына жараша машиналык үйрөнүү ыкмаларын классификациялоо керек болсо, анда нейрон тармактарын белгилүү бир типке классификациялоо туура эмес болуп калат, нейрондук тармакты окутуу алгоритмдерин классификациялоо туура болот;

  • Мугалим менен окутуу — ар бир прецедент үчүн "кырдаал, талап кылынган чечим"жуп берилет:
  1. Жасалма нейрон тармагы
    1. Терең үйрөнүү
  2. Ката оңдоо ыкмасы
  3. Артка жайылтуу ыкмасы
  4. Колдоо вектордук машина
  • Көзөмөлсүз окутуу - ар бир прецедент үчүн объекттердин жуптук окшоштугу боюнча маалыматтарды пайдалануу менен объекттерди кластерлерге топтоо жана/же маалыматтардын өлчөмүн азайтуу талап кылынат;
  1. Alpha бекемдөө системасы
  2. Гамма күчөтүү системасы
  3. Жакынкы кошуналар ыкмасы
  • Окутууну бекемдөө - ар бир прецедент үчүн бир жуп "жагдай, кабыл алынган чечим" бар:
  1. Генетикалык алгоритм .
  • Активдүү окутуу - окутуу алгоритминин туура жооп белгилүү боло турган кийинки изилденүүчү кырдаалды өз алдынча дайындоо мүмкүнчүлүгү бар экендиги менен айырмаланат:
  • Мугалимдерди жарым-жартылай окутуу (англ. semi-supervised learning ) - кээ бир прецеденттер үчүн жуп "жагдай, талап кылынган чечим" көрсөтүлөт, ал эми кээ бирлери үчүн - бир гана "ситуация"
  • Трансдуктивдүү окутуу - болжолдоо тесттик үлгүдөгү прецеденттерге гана жасалышы керек болгон мугалимдин жарым-жартылай катышуусу менен окутуу.
  • Көп тапшырманы үйрөнүү (англ. multi-task learning ) - өз ара байланышкан милдеттердин тобун бир эле учурда окутуу, алардын ар бири үчүн өзүнүн "жагдай, талап кылынган чечим" жуптары көрсөтүлөт.
  • көп варианттуу тренинг (англ. multiple-instance learning ) - прецеденттерди топторго бириктирүү мүмкүн болгондо үйрөнүү, алардын ар биринде бардык прецеденттер үчүн "жагдай" бар, бирок алардын бирөө үчүн гана (кайсысы белгисиз) жуп "кырдаал" бар., талап кылынган чечим”
  • жогорулатуу (англ. boosting - өркүндөтүү) - ар бир кийинки алгоритм мурунку бардык алгоритмдердин курамындагы кемчиликтердин ордун толтурууга аракет кылганда, машина үйрөнүү алгоритмдеринин курамын ырааттуу түзүү процедурасы.
  • Байес тармагы

Классикалык көйгөйлөр машина үйрөнүү аркылуу чечилет[түзөтүү | булагын түзөтүү]

  • Классификация, адатта, окутуу баскычында көзөмөлдөнгөн окутууну колдонуу менен жүзөгө ашырылат.
  • Кластерлөө, адатта , көзөмөлсүз окутуунун жардамы менен жүргүзүлөт
  • Регрессия, адатта, тестирлөө баскычында көзөмөлдөнгөн окутуунун жардамы менен аткарылган, прогноз көйгөйлөрүнүн өзгөчө учуру.
  • Маалыматтын өлчөмдүүлүгүн азайтуу жана визуалдаштыруу көзөмөлсүз окутуунун жардамы менен ишке ашырылат
  • Маалымат топтомунан ыктымалдык тыгыздык функциясын калыбына келтирүү
  • Бир класстык классификация жана жаңылыктарды аныктоо
  • Даражадагы көз карандылыктарды куруу
  • Аномалияны аныктоо

Окутуу материалдарынын түрлөрү[түзөтүү | булагын түзөтүү]

  • Объекттердин өзгөчөлүккө негизделген сыпаттамасы же объект-атрибут матрицасы эң кеңири таралган учур болуп саналат. Ар бир объект атрибуттардын жыйындысы менен сүрөттөлөт.
  • Объекттердин ортосундагы аралыктардын матрицасы . Ар бир объект окутуу топтомундагы бардык башка объекттерге чейинки аралыктар менен, көбүнчө жуптук окшоштук мамилелери менен сүрөттөлөт.
  • Убакыт сериясы же сигнал . Убакыт боюнча өлчөөлөрдүн ырааттуулугу, ал сан, вектор жана жалпы учурда убакыттын берилген учуруна мүнөздүү сүрөттөлүшү менен көрсөтүлүшү мүмкүн.
  • Сүрөт же видео ырааттуулугу .
  • Табигый тилди иштетүү аркылуу жөнөкөй текст.

Сапаттуу функциялардын түрлөрү[түзөтүү | булагын түзөтүү]

  • Мугалим менен окууда сапат функционалдуулугун жооптордун орточо катасы катары аныктоого болот. Керектүү алгоритм аны минималдаштыруу керек деп болжолдонууда. Ашыкча тууралоону болтурбоо үчүн, ачык же кыйыр түрдө минималдаштырылган сапат функциясына регуляризатор кошулат.
  • Мугалимсиз окутууда сапат функцияларын ар кандай жолдор менен аныктоого болот, мисалы, кластер аралык жана кластер аралык орточо аралыктардын катышы.
  • Окутуу процессинде сапаттык функциялар физикалык чөйрө менен аныкталат, ал агенттин адаптациясынын сапатын көрсөтөт.

Практикалык колдонмолор[түзөтүү | булагын түзөтүү]

Машина үйрөнүүнүн максаты адамдын ишмердүүлүгүнүн ар түрдүү чөйрөлөрүндөгү татаал профессионалдык маселелерди чечүүнү жарым-жартылай же толук автоматташтыруу болуп саналат.

  • Кепти таануу
  • Жаңсоо таануу
  • Колжазманы таануу
  • Үлгү таануу
  • Техникалык диагностика
  • Медициналык диагностика
  • Убакыт серияларын болжолдоо
  • Биоинформатика
  • Алдамчылыкты аныктоо
  • Спамды аныктоо
  • Документтердин категориялары
  • Запастын техникалык анализи
  • Финансылык көзөмөл (ошондой эле караңыз : Финансылык кылмыштар )
  • Кредиттик балл
  • Кардарлардын бузулушун алдын ала айтуу
  • Хемоинформатика
  • Маалымат издөөдө рейтингге үйрөтүү

Машина үйрөнүү колдонмолорунун чөйрөсү тынымсыз кеңейүүдө. Кеңири жайылган маалыматташтыруу илимде, өндүрүштө, бизнесте, транспортто жана саламаттыкты сактоодо чоң көлөмдөгү маалыматтардын топтолушуна алып келет. Прогноздоо, башкаруу жана чечимдерди кабыл алуу көйгөйлөрү көбүнчө прецеденттерден үйрөнүүгө кыскарат. Мурда мындай маалыматтар жок болгондо, бул милдеттер такыр коюлган эмес же такыр башка ыкмалар менен чечилчү.

Прецеденттер боюнча окутуу маселесинин жалпы билдирүүсү[түзөтүү | булагын түзөтүү]

  1. Лекун, 2021, к. 78


Цитатанын катасы: <ref> tags exist for a group named "lower-alpha", but no corresponding <references group="lower-alpha"/> tag was found