Читать книгу Chat GPT и Революция Искусственного Интеллекта онлайн

8 страница из 37

Как работает ChatGPT?

ChatGPT – это можно сказать улучшенная версия предыдущей модели GPT 3, которая была натренирована на миллиардах слов и предложений по всему интернету. Когда он генерирует текст, он пытается предсказать каким должно быть следующее слово в данном конкретном предложении, опираясь на свою огромную выборку текстов. Конечным результатом становится имитация текста, написанного якобы человеком. ChatGPT еще иногда называют GPT 3.5, и основным различием является то, что OpenAI добавили обратную связь от людей в процесс обучения. Это называется Supervised Reinforcement Learning – обучение с учителем с подкреплением.

Почему это называется «обучение с учителем»? Потому что во время обучения модели, различные версии ответов на тот или иной запрос программой ранжируются человеком по качеству ответа: от наилучшей к худшей, и программе дается цифровое поощрение, когда она улучшает качество своего ответа. Модель дальше подвергается тонкой донастройке и регулированию, и процесс повторяется несколько раз.

Правообладателям