[ WebToolTip.com ] Udemy - LLM Reinforcement Learning Fine-Tuning DeepSeek Method GRPO

Creation Time	April 2, 2026, 12:38 p.m.
Last Access Time	July 5, 2026, 2:29 a.m.
File Size	1.8 GB
Keywords	GRPO WebToolTip DeepSeek - Learning Reinforcement Udemy LLM com Method Fine-Tuning
Total Requests	680
Total Files	108
Magnet Link	Please wait ...
	Download (Magnet Link) Play (Watch Online)

~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/10. Preparing Dataset, Chat Template, and Integrating Custom Tokens.mp4 145.9 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/34. In Which Format is Data Sent to Reward Functions.mp4 88.9 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/12. What is a Data Collator How Does It Work Practical Example.mp4 84.6 MB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/25. Preparing the Dataset for DPO.mp4 84.4 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/41. Results Table Rewards and Sample Outputs.mp4 78.4 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/8. Differences Between Base and Instruct Models.mp4 78.0 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/37. 3rd Reward Function.mp4 77.9 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/36. 2nd Reward Function.mp4 73.2 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/35. 1st Reward Function.mp4 64.4 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/31. What are Unsloth and VLLM + Download the Model.mp4 62.7 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/39. Training Hyperparameters (with GRPO Config).mp4 61.3 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/29. What is a “Reasoning” Model How Does It Work.mp4 56.5 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/32. Examining the Dataset and Initial Preparation Steps.mp4 54.0 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/17. Merging Trained LoRA Matrices with the Model.mp4 51.0 MB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/28. Training the Model and Merging the LoRA Matrices.mp4 49.7 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/33. Extracting Specific Parts of Data Regex and Group Operations.mp4 49.5 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/18. Uploading Model on Hugging Face and Using it.mp4 49.4 MB
~Get Your Files Here !/1 - Introduction/2. Course Content Introduction.mp4 47.7 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/11. Continuing Dataset Preparation and Tokenization.mp4 47.0 MB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/24. Downloading Model & Understanding How the DPO Data Collator do Padding.mp4 45.4 MB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/23. What is DPO What Data Format Does It Expect.mp4 43.4 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/4. What is Quantization How does it affect model size and parameters.mp4 40.2 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/14. Integrating LoRA Matrices into the Model.mp4 37.6 MB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/20. Download the Model and Tokenizer.mp4 37.0 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/5. Create a Hugging Face Account and Get a Token.mp4 35.1 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/15. Setting Training Arguments (Training Hyperparameters).mp4 32.1 MB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/21. Adding New Custom Tokens to the Tokenizer.mp4 30.9 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/19. Hyperparameters Affecting the Outputs.mp4 30.3 MB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/22. Creating Templates with New Custom Tokens and Integrating Them into the Dataset.mp4 28.7 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/7. Download the Model with Quantization.mp4 27.5 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/38. 4th Reward Function.mp4 26.6 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/16. Setting Trainer, Starting Training, and Evaluating Results.mp4 21.4 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/30. What is GRPO How Is It Applied.mp4 21.4 MB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/26. Adding LoRA Matrices to the Model.mp4 19.1 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/9. Download and Examine the Dataset.mp4 18.9 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/13. What is LoRA Why Use It.mp4 17.0 MB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/6. Create a Colab Notebook and Get Familiar with the Libraries.mp4 14.7 MB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/27. Setting Training Arguments (with DPOConfig).mp4 13.3 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/40. Trainer Object and Training Process.mp4 12.0 MB
~Get Your Files Here !/1 - Introduction/1. Introduction.mp4 11.4 MB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/42. SFT_GRPO_Training.ipynb.bin 10.0 MB
~Get Your Files Here !/6 - BONUS_New_GRPO_Notebook/43. SFT_GRPO_Training.ipynb.bin 10.0 MB
~Get Your Files Here !/1 - Introduction/Notebooks 2/Bolum_(Section)_4_GRPO_.ipynb 624.2 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/29. Bolum_(Section)_4_GRPO_.ipynb.bin 624.2 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/31. Bolum_(Section)_4_GRPO_.ipynb.bin 624.2 KB
~Get Your Files Here !/1 - Introduction/Notebooks 2/Bolum_(Section)_1.ipynb 465.1 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/7. Bolum_(Section)_1.ipynb.bin 465.1 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/8. Bolum_(Section)_1.ipynb.bin 465.0 KB
~Get Your Files Here !/1 - Introduction/Notebooks 2/Bolum_(Section)_3_DPO.ipynb 259.4 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/24. Bolum_(Section)_3_DPO.ipynb.bin 259.4 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/23. Bolum_(Section)_3_DPO.ipynb.bin 259.4 KB
~Get Your Files Here !/1 - Introduction/Notebooks 2/Bolum_(Section)__2.ipynb 207.9 KB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/20. Bolum_(Section)__2.ipynb.bin 207.9 KB
~Get Your Files Here !/1 - Introduction/Notebooks 2/Quantization.ipynb 81.9 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/4. Quantization.ipynb.bin 81.9 KB
~Get Your Files Here !/1 - Introduction/Notebooks 2/Thinking__(REASONING)_model.ipynb 54.8 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/29. Thinking__(REASONING)_model.ipynb.bin 54.8 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/33. Extracting Specific Parts of Data Regex and Group Operations.en_US.srt 13.5 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/10. Preparing Dataset, Chat Template, and Integrating Custom Tokens.en_US.srt 13.3 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/35. 1st Reward Function.en_US.srt 13.1 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/36. 2nd Reward Function.en_US.srt 12.3 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/37. 3rd Reward Function.en_US.srt 11.1 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/25. Preparing the Dataset for DPO.en_US.srt 10.9 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/15. Setting Training Arguments (Training Hyperparameters).en_US.srt 9.8 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/12. What is a Data Collator How Does It Work Practical Example.en_US.srt 9.1 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/8. Differences Between Base and Instruct Models.en_US.srt 8.5 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/39. Training Hyperparameters (with GRPO Config).en_US.srt 8.3 KB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/21. Adding New Custom Tokens to the Tokenizer.en_US.srt 8.0 KB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/22. Creating Templates with New Custom Tokens and Integrating Them into the Dataset.en_US.srt 7.7 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/14. Integrating LoRA Matrices into the Model.en_US.srt 7.6 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/32. Examining the Dataset and Initial Preparation Steps.en_US.srt 7.6 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/23. What is DPO What Data Format Does It Expect.en_US.srt 7.5 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/38. 4th Reward Function.en_US.srt 7.2 KB
~Get Your Files Here !/6 - BONUS_New_GRPO_Notebook/43. BONUS_New_GRPO_Notebook.html 7.1 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/42. BONUS_New_GRPO_Notebook.html 7.1 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/24. Downloading Model & Understanding How the DPO Data Collator do Padding.en_US.srt 7.1 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/34. In Which Format is Data Sent to Reward Functions.en_US.srt 7.0 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/28. Training the Model and Merging the LoRA Matrices.en_US.srt 6.9 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/31. What are Unsloth and VLLM + Download the Model.en_US.srt 6.9 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/17. Merging Trained LoRA Matrices with the Model.en_US.srt 6.8 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/7. Download the Model with Quantization.en_US.srt 6.8 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/19. Hyperparameters Affecting the Outputs.en_US.srt 6.5 KB
~Get Your Files Here !/1 - Introduction/Notebooks 2/DS_Store 6.0 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/18. Uploading Model on Hugging Face and Using it.en_US.srt 5.7 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/11. Continuing Dataset Preparation and Tokenization.en_US.srt 5.6 KB
~Get Your Files Here !/1 - Introduction/3. Jupyter Notebooks.html 5.4 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/27. Setting Training Arguments (with DPOConfig).en_US.srt 5.4 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/5. Create a Hugging Face Account and Get a Token.en_US.srt 5.0 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/29. What is a “Reasoning” Model How Does It Work.en_US.srt 5.0 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/30. What is GRPO How Is It Applied.en_US.srt 4.9 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/4. What is Quantization How does it affect model size and parameters.en_US.srt 4.9 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/6. Create a Colab Notebook and Get Familiar with the Libraries.en_US.srt 4.7 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/9. Download and Examine the Dataset.en_US.srt 4.7 KB
~Get Your Files Here !/3 - Adding New Tokens and Creating Templates for the Tokenizer/20. Download the Model and Tokenizer.en_US.srt 4.6 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/41. Results Table Rewards and Sample Outputs.en_US.srt 4.3 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/16. Setting Trainer, Starting Training, and Evaluating Results.en_US.srt 3.9 KB
~Get Your Files Here !/4 - DPO (Direct Preference Optimization)/26. Adding LoRA Matrices to the Model.en_US.srt 3.8 KB
~Get Your Files Here !/2 - Quantization, LoRA, SFT, Data Collator, Data Preparation…/13. What is LoRA Why Use It.en_US.srt 3.4 KB
~Get Your Files Here !/5 - GRPO (Group Relative Policy Optimization) Reinforcement Learning/40. Trainer Object and Training Process.en_US.srt 2.6 KB
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_Bolum_(Section)_1.ipynb 696 bytes
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_Bolum_(Section)_4_GRPO_.ipynb 497 bytes
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_Bolum_(Section)_3_DPO.ipynb 411 bytes
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_Quantization.ipynb 392 bytes
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_Bolum_(Section)__2.ipynb 212 bytes
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_Thinking__(REASONING)_model.ipynb 212 bytes
Get Bonus Downloads Here.url 180 bytes
~Get Your Files Here !/1 - Introduction/__MACOSX/Notebooks 2/_.DS_Store 120 bytes
~Get Your Files Here !/Bonus Resources.txt 70 bytes

[ WebToolTip.com ] Udemy - LLM Reinforcement Learning Fine-Tuning DeepSeek Method GRPO

File List

Download Torrent

Related Resources

Copyright Infringement