{"version":"1.0","type":"rich","provider_name":"gaks.ai AI Glossary","provider_url":"https://gaks.ai/glossary","title":"Reinforcement Learning from Human Feedback — AI Glossary","author_name":"Glenn Katrud Solheim","author_url":"https://gaks.ai","width":600,"height":200,"html":"<div style=\"font-family:sans-serif;border:1px solid #e0e0e0;border-radius:8px;padding:16px;max-width:600px;background:#ffffff;color:#111111;\"><p style=\"margin:0 0 4px;font-size:11px;color:#666;\">AI Glossary — gaks.ai</p><h3 style=\"margin:0 0 8px;font-size:16px;\">Reinforcement Learning from Human Feedback (RLHF)</h3><p style=\"margin:0 0 12px;font-size:14px;line-height:1.6;\">A training approach where a language model is fine-tuned using feedback from human raters who compare and rank model outputs. The human preferences are used to train a reward model, which then guides further training via reinforcement learning. RLHF has been central to making large language models more helpful, harmless, and honest.</p><a href=\"https://gaks.ai/glossary/reinforcement-learning-from-human-feedback\" style=\"font-size:12px;color:#0077aa;\">Source: gaks.ai/glossary/reinforcement-learning-from-human-feedback →</a></div>"}