GitHub - atom2-source/-Gemini-AI-Studio-Fine-Tuning-Dataset-Creator: upgraded gemini ai studio test application for fine tunning expert models

Gemini AI Studio Fine-Tuning Dataset Creator

Built for Gemma models fine tuning

A PyQt5-based GUI application designed to generate structured fine-tuning datasets in the Dolly format using Google Gemini AI. This tool is particularly useful for creating high-quality training data from technical manuals or any subject-specific content. Features

Dolly Format Dataset Generation: Creates training data following the Dolly instruction format, which includes instruction, context, response, and category fields Bulk Context & Category Labeling: Add consistent context and category labels across all entries for efficient dataset organization Flexible Subject Support: While designed for technical manuals, it works with any subject matter - just set the "machine name" to your topic of interest (e.g., "green tree frogs", "quantum physics") Reference Q&A Integration: Input previous Q&A pairs to avoid duplicates and guide new question generation Dark Mode Interface: Material Design-inspired dark theme for comfortable extended use Multiple Gemini Models: Support for various Gemini AI models with real-time rate limit tracking File Management: Import source text from files and export structured datasets in JSON or text format

Rate Limiting & API Usage The application includes real-time tracking of API usage with built-in rate limiting for different Gemini models. This helps prevent hitting API limits while working with larger datasets. Installation & Setup

Clone the repository Install required packages

Set your GEMINI_API_KEY environment variable Run the application

Dataset Format The tool now generates data in the Dolly instruction format:

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
gemini_fine_tuning.py		gemini_fine_tuning.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

About

Uh oh!

Releases

Packages

Languages

License

atom2-source/-Gemini-AI-Studio-Fine-Tuning-Dataset-Creator

Folders and files

Latest commit

History

Repository files navigation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages