Improved-Language-Model-Instructions-Tuning-using-Alpaca-Dataset

In this project, I explored different prompt types for Large Language Models.

Alpaca Dataset

I utilized the "Alpaca" dataset, which comprises 52,000 instructions and demonstrations generated by OpenAI's text-davinci-003 engine. This instruction data is ideal for conducting instruction-tuning for language models, enhancing their ability to follow instructions effectively.

Dataset Link: Alpaca Dataset

Large Language Models (LLMs)

I employed six different types of Large Language Models for this task. Here are the details along with their respective links:

GPT2

Model Link: GPT2 Documentation
GPT-Medium

Model Link: GPT-Medium
Mistral-7B-v0.1

Model Link: Mistral-7B-v0.1
TinyLlama-1.1B-Chat-v1.0

Model Link: TinyLlama-1.1B-Chat-v1.0
Mistral-7B-Instruct-v0.2

Model Link: Mistral-7B-Instruct-v0.2
Starling-LM-7B-alpha

Model Link: Starling-LM-7B-alpha

Feel free to explore these models and the Alpaca dataset for a deeper understanding of the project's advancements in language model instruction tuning.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Instructions_Tuning_using_GPT2.ipynb		Instructions_Tuning_using_GPT2.ipynb
Instructions_Tuning_using_GPT_2_Medium.ipynb		Instructions_Tuning_using_GPT_2_Medium.ipynb
Instructions_Tuning_using_Mistral_7B.ipynb		Instructions_Tuning_using_Mistral_7B.ipynb
Instructions_Tuning_using_Mistral_7B_Instruct_v0_2_.ipynb		Instructions_Tuning_using_Mistral_7B_Instruct_v0_2_.ipynb
Instructions_Tuning_using_Starling_LM_7B_alpha.ipynb		Instructions_Tuning_using_Starling_LM_7B_alpha.ipynb
Instructions_Tuning_using_TinyLlama.ipynb		Instructions_Tuning_using_TinyLlama.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Improved-Language-Model-Instructions-Tuning-using-Alpaca-Dataset

Alpaca Dataset

Large Language Models (LLMs)

GPT2

GPT-Medium

Mistral-7B-v0.1

TinyLlama-1.1B-Chat-v1.0

Mistral-7B-Instruct-v0.2

Starling-LM-7B-alpha

About

Releases

Packages

Languages

fatemafaria142/Instructions-Tuning-Across-Various-LLMs-with-Alpaca-Dataset

Folders and files

Latest commit

History

Repository files navigation

Improved-Language-Model-Instructions-Tuning-using-Alpaca-Dataset

Alpaca Dataset

Large Language Models (LLMs)

GPT2

GPT-Medium

Mistral-7B-v0.1

TinyLlama-1.1B-Chat-v1.0

Mistral-7B-Instruct-v0.2

Starling-LM-7B-alpha

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages