Языковые модели (Language Models, LM) — это модели машинного обучения, которые умеют понимать и генерировать текст на человеческом языке. Они анализируют большие объемы текстовых данных, чтобы выявить закономерности и связи между словами, что позволяет им выполнять различные задачи, связанные с текстом.
Большие языковые модели (Large Language Models, LLM) — это особый вид языковых моделей, которые отличаются огромным количеством параметров и обучаются на очень больших наборах текстовых данных. Это позволяет им демонстрировать впечатляющие результаты в различных областях, таких как генерация текста, перевод языков, анализ настроений и ответы на вопросы. Примерами популярных LLM являются GPT-4.
Малые языковые модели (Small Language Models, SLM), в свою очередь, являются более компактными и эффективными версиями LLM. Они обладают меньшим количеством параметров, что делает их менее требовательными к вычислительным ресурсам и позволяет быстрее их обучать и использовать. SLM часто специализируются на конкретных задачах и областях применения, где они демонстрируют высокую точность. Примерами популярных SLM являются DistilBERT, BERT Mini, Orca 2, Phi 3 и T5-Small.
Бесплатное open-source Jan.ai функционирует как десктопное приложение, которое можно установить на ваш компьютер. Позволяет запускать большие языковые модели (LLM) локально на вашем компьютере. Предоставляет API-сервер, совместимый с OpenAI, что позволяет интегрировать его с другими приложениями и сервисами. Алгоритм использования приложения:
Jan поддерживает различные модели, такие как Llama3, Gemma и Mistral, которые можно загрузить и использовать непосредственно на вашем устройстве.
Jan по умолчанию предлагает установить на выбор Llama 3.2 1B Instruct Q8 и Llama 3.2 3B Instruct Q8.
Они различаются по размеру и, следовательно, по возможностям:
Выбор между этими моделями зависит от конкретных задач и доступных вычислительных ресурсов. Если вам нужна быстрая модель для простых задач, 1B Instruct Q8 будет подходящим выбором. Для более сложных задач, например мне нужна разработка на PHP выбираем 3B Instruct Q8.