Llama-CPP
msty app
Jan for Desktop
open-webui на Linux
AnythingLLM
LM Studio
Appimage extract
Text-Generation-Webui
Miniconda3
TavernAI для Text-Generation-Webui
Stable-Diffusion-Webui
one-click-installers
KoboldAI или KoboldAI GIT
Krita
Krita AI Diffusion
SubTitleEdit
stabilityai/stable-diffusion-3.5-large-turbo
Image Creator
Stability Matrix
DALL·E mini

Параметры

VRAM и RAM для запуска модели
Квантизации и требования к оперативной памяти
Форматы с плавающими точками

Модели

Mykes/medicus, TheBloke/medalpaca-13B-GGUF, TheBloke/med42-70B-GGUF
gemma3:4b
codegemma
codellama
dolphin-mistral:7b
dolphin-mixtral
llava
falcon
llama2-uncensored
reefer/erplegend
gdisney/neural-chat-uncensored
reefer/erphermesl3
jimscard/adult-film-screenwriter-nsfw
TheBloke/Llama-2-7B-GGUF
nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF
saiga2 7b gguf stable-diffusion model
PygmalionAI
Другие
Lora Model
Gemini
Claude Haiku
DeepSeek

Конвертирование моделей
Запуск GGML/GGUF через ollama

Modelfile
Квантизация моделей
Работа с несколькими вариантами одной модели

Программирование
Загрузка моделей с Hugginface
Дополнительная информация

Нейронные сети на Android / IOS

Интерфейсы
Параметры
Модели
Итоги

Ollama VPS/VDS

Ollama
Подключение поисковых утилит на open-webui

VPS/VDS n8nio/n8n

1. Нейронные сети на ПК

Что такое нейросети, модели и квантизация?

Нейросеть — это математическая модель, вдохновлённая работой мозга, которая состоит из множества взаимосвязанных "нейронов" (узлов). Она обучается на данных, чтобы решать задачи: распознавать изображения, переводить текст, генерировать контент и т.д.
Модель — это конкретная обученная нейросеть с набором параметров (весов), которые она получила в процессе обучения. Например, модель GPT-2 — это нейросеть, обученная генерировать текст.
Квантизация — это способ уменьшить размер модели и ускорить её работу, переводя параметры из высокоточных чисел (например, 32-битных float) в более компактные форматы (например, 8-битные int). Это снижает требования к памяти и вычислениям, иногда с небольшой потерей качества, но часто незаметной для пользователя.

Что такое LoRA (Low-Rank Adaptation)?

LoRA — это метод тонкой настройки (fine-tuning) больших моделей, который позволяет адаптировать модель под новую задачу, обучая лишь небольшую часть параметров, а не всю модель целиком.
Идея в том, что вместо изменения огромной матрицы весов модели, LoRA добавляет две маленькие матрицы низкого ранга, которые корректируют поведение модели. Это значительно снижает вычислительные затраты и объём данных для обучения, сохраняя при этом высокое качество результата.
Такой подход особенно полезен для дообучения больших языковых моделей (LLM) и генеративных моделей, когда нет ресурсов для полного переобучения.

1.1. Програмное обеспечение

Далее ниже указан список програмного обеспечения для работы с нейронными сетями.

Нужно понимать, что одни программы предназначены только для работы на Linux, другие только на Windows,т.е. далеко не все могут работать в обеих ОС.

Также есть нюанс касающийся самих программ для работы с теми или иными моделями нейронных сетей - это конкретные задачи, которые нижеуказанные программы могут или не могут выполнять. Один тип программ только для работы с текстом, другие для работы с изображениями, третьи для работы с видео, субтитрами и т.д. и т.п.

Для каждой программы я указываю несколько типов ссылок.

Ссылка на официальный сайт - обязательна.
Git https ссылка - Если это Git репозиторий.
Git ssh ссылка - Для более быстрого скачивания через Git.
Git Release ссылка - чтобы сразу найти последнюю версию программы.
И ссылки на сами программы для разных ОС и разных архитектур - i686 (x86), amd64 (x86_64).

Для каждой программы если это не официальный сайт, а конкретно Git репозиторий - внутри каждого есть инструкция по установке и использованию, поэтому добавлять ее сюда и загромождать место не имеет смысла. Информация в этом случае будет дублироваться, а если при обновлении в репозитории хоть что-то изменится - то она даже будет не актуальна.

У меня на Linux - используется пользвотель «Mikl». И для запуска я испольную отдельную папку с иконкой и скриптом запуска просто для удобства.

Нюанс. У меня установлен «Python» и «virtualenvwrapper». Как установить его на Linux или Windows можно посмотреть здесь.

В папке пользователя создана отдельная директория, например «/home/mikl/programs/ollama-apps/».

Еще один нюанс - В Linux я чаще использую «.Appimage» формат введу его универсальности, т.к. он уже содержит в себе все необходимые библиотеки и устанавливать их в систему и думать будут ли они конфликтовать с теми, что там уже есть - мне не приходится.

И еще «.Appimage» архив запуска я обязательно распаковываю в отдельную папку для ускорения работы с программой и также удобства работы с ней, т.к. появляются настройки, которые можно вытащить, скопировать, перенести и т.д. и т.п.

Распаковать «.Appimage» формат запуска можно вот так.

Поясняю нюанс по поводу всех форматов файлов в Linux. В Linux все файлы не важно какого формата по сути текстовые и редактируются, даже если это просто ярлычок запуска с рабочего стола. Удобнее всего использовать «Редактор Geany» для редактирования файлов. Важно только то, где эти файлы располагаются и имеют ли права доступа для запуска. Иногда их просто подключают как начальную точку входа в тот или иной скрипт, а иногда используют просто как информацию, а иногда такой файл бывает полноценным скриптом даже без формата. Если у файла есть права доступа для запуска, то файл является выполняемым, как .bat или .cmd в Windows, только здесь ну нужны никакие форматы.

Например, любой ярлычок запуска на рабочем столе. По сути представляет из себя некий ini-файл в котором указаны параметры его работы и ему даны права доступа для запуска. В Windows не полноценный аналог - простой ярлык на какой-то файл, если посмотреть его свойства правой кнопкой мыши. Не полноценный, потому что в Linux гораздо больше возможностей настроек запуска того или иного ПО. В Windows только указать путь к файлу запуска и корневую директорию.

Также не забудьте установить саму Ollama программу, потому что без неё у вас ни одна другая утилита не заработает.

На указанном официальном сайте есть версия и для Windows, и для Linux.

Для Linux следуйте вот этой инструкции.

Установить новую версию, если программы еще не существует в ОС.

curl -fsSL https://ollama.com/install.sh | sh

А вот обновление Ollama чутка сложнее.

1. Сначала надо Удалить старые библиотеки.

sudo rm -rf /usr/lib/ollama

2. Скачать и распаковать пакет.

curl -fsSL https://ollama.com/download/ollama-linux-amd64.tgz | sudo tar zx -C /usr

3. Запустить Ollama.

ollama serve

4. В другом терминале проверить, что Ollama запущен.

ollama -v

Ну или так.

sudo systemctl status ollama

Если не получается запустить сервис ollama.

sudo systemctl daemon-reload
sudo systemctl restart ollama

Нюанс по поводу комманд на Linux.

Если ОС не выполняет команду - выдаёт ошибку, попробуйте добавить в начале команды: «sudo».

Это повысит права доступа до root-а и команду можно будет выполнить принудительно.

Нюанс по поводу Python-а.

Если вам нужен Python, наиболее свежей версии, то скачать его лучше всего с официального сайта.

Если же у вас более старая система, или вы хотите адекватную портативную версию Python-а, то одну из версий можно скачать из моего репозитория python-portable-links.

Если же вы в принципе не умеете работать с Python-ом - прочитайте хотя бы «базовое руководство по виртуальным окружениям, а также установке и запуску портативных версий их преимуществ».

Официальный сайт Ollama.

Python версия Llama-CPP

Llama-CPP — минималистичный open-source движок для запуска больших языковых моделей (LLM) на CPU и GPU с поддержкой web-интерфейса и API.

Установка и запуск. Это Python версия, с ней можно работать через Python и виртуальное окружение. Это нормальная практика.

git clone https://github.com/ggerganov/llama.cpp.git
pip install -r llama.cpp/requirements.txt
python llama.cpp/convert.py -h
python llama.cpp/convert.py vicuna-hf \ --outfile vicuna-13b-v1.5.gguf \ --outtype q8_0
# --outtype f16
# --outtype f32
# --outtype bf16

Установка на Linux и использование.

$ ollama show your-model-exist:latest --modelfile > Modelfile
$ nano Modelfile # Example

# FROM Model-Name
FROM /YOUR/PATH/Local-Models/Model-Name.ext-model
TEMPLATE "<|im_start|>system
{{ .System }}<|im_end|>
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"
SYSTEM You are my-own-model, a helpful AI assistant.
PARAMETER stop <|im_start|>
PARAMETER stop <|im_end|>

$ ollama create my-own-model -f Modelfile
$ ollama run my-own-model

Приложение msty app

msty app — приложение для работы с локальными языковыми моделями с удобным интерфейсом и поддержкой различных форматов моделей.

Приложение Jan for Desktop

Jan for Desktop — локальный AI-ассистент с возможностью работы с языковыми моделями и интеграцией в рабочий процесс.

Использование open-webui на Linux.

open-webui на Linux — веб-интерфейс для запуска и управления локальными языковыми моделями на Linux-системах.

curl -LsSf https://astral.sh/uv/install.sh | sh
pip install open-webui
open-webui serve
pip install --upgrade open-webui

Файл «/home/mikl/programs/ollama-apps/bashrc».

export WORKON_HOME=$HOME/programs/ollama-apps/open-webui/open-webui-env
export PROJECT_HOME=$HOME/programs/ollama-apps/open-webui/
export VIRTUALENVWRAPPER_PYTHON=/usr/bin/python
export VIRTUALENVWRAPPER_VIRTUALENV=/usr/bin/virtualenv
# export VIRTUALENVWRAPPER_VIRTUALENV_ARGS='--no-site-packages'
export PIP_VIRTUALENV_BASE=$WORKON_HOME
export PIP_RESPECT_VIRTUALENV=true
source /usr/local/sbin/virtualenvwrapper.sh
#if [[ -r `which virtualenvwrapper.sh` ]]; then source `which virtualenvwrapper.sh`; fi

Файл «/home/mikl/programs/ollama-apps/open-webui-run.sh».

#!/bin/bash
source /home/mikl/programs/ollama-apps/open-webui/bashrc
workon ollama-env
open-webui serve

Иконка для скачивания - «open-webui-icon.png».

И конечно же сам файл запуска на рабочем столе «Open-WebUI.desktop».

[Desktop Entry]
Exec=/home/mikl/programs/ollama-apps/open-webui/open-webui-run.sh
Type=Application
Name=Open-WebUI
Terminal=true
Icon=/home/mikl/programs/ollama-apps/open-webui/open-webui-icon.png

Приложение AnythingLLM

AnythingLLM — универсальный фронтенд для запуска и взаимодействия с различными локальными языковыми моделями.

Для AnythingLLM я использую вот такую иконку «anythingllm-desktop.png» и ярлычок запуска «anythingllm-desktop.desktop» на рабочем столе.

[Desktop Entry]
Name=AnythingLLM
Exec=/home/mikl/programs/anythingllm-desktop/AppRun --no-sandbox %U
Terminal=false
Type=Application
Icon=/home/mikl/programs/anythingllm-desktop/usr/share/icons/hicolor/1024x1024/apps/anythingllm-desktop.png
StartupWMClass=AnythingLLM
X-AppImage-Version=1.7.2
Comment=AnythingLLM Desktop Application
MimeType=x-scheme-handler/anythingllm;
Categories=Utility;

Приложение LM Studio

LM Studio — приложение для локального запуска и управления большими языковыми моделями с удобным графическим интерфейсом.

Иконка запуска LM Studio «lm-studio.png» и ярлычок запуска на рабочем столе «lm-studio.desktop».

[Desktop Entry]
Name=LM Studio
Exec=/home/mikl/programs/LM-Studio-0.3.6-8-x64/LM-Studio-0.3.6-8-x64-appimage-extract/AppRun --no-sandbox %U
Terminal=false
Type=Application
Icon=/home/mikl/programs/LM-Studio-0.3.6-8-x64/LM-Studio-0.3.6-8-x64-appimage-extract/usr/share/icons/hicolor/0x0/apps/lm-studio.png
StartupWMClass=LM Studio
X-AppImage-Version=0.3.6
Comment=Use the chat UI or local server to experiment and develop with local LLMs.
Keywords=developer;llm;
category=Development;Utility;
MimeType=x-scheme-handler/lmstudio;
Categories=Development;

Appimage extract — код для распаковки и извлечения содержимого из любого AppImage-файлов на Linux.

Appimage extract:

./Application_xxx-version.AppImage --appimage-extract
# Извлекли, посмотрели категорию ПО
cat /usr/share/applications/Your-Apps_x-vers.desktop | grep -Ei "Categories"
# Отредактировали ярлычок запуска который будем вытаскивать на рабочий стол, прописывая полные пути
nano ./squashfs-root/Application_xxx-version.desktop
# Ну и не забыли добавить разрешение на выполнения/запуск
chmod +x ./squashfs-root/AppRun
chmod +x ./squashfs-root/*.desktop

# А вот так упаковываем обратно. Сначала нужна утилита для упаковки.
wget "https://github.com/AppImage/AppImageKit/releases/download/continuous/appimagetool-x86_64.AppImage"
chmod +x ./appimagetool-x86_64.AppImage
# Упаковываем из директории squashfs-root. Все пути внутри в скриптах должны быть относительными.
ARCH=x86_64 /appimagetool-x86_64.AppImage -n squashfs-root

Несколько возможных причин, по которым LM Studio не загружает модель, и способы их устранения:

Размер модели больше объёма VRAM. Если в LM Studio пытаются выгрузить модель на графический процессор, её размер должен быть меньше объёма VRAM, чтобы модель поместилась туда. Попробуйте установить значение «GPU offload» в 0 или отключить эту функцию.
Включение функции «Keep entire model in RAM». Если её отключить, то можно запросить модель и получить ответ.
Использование видеокарты для загрузки модели. Если на видеокарте достаточно памяти для модели, то можно попробовать использовать её. Для этого нужно кликнуть на галочку «GPU Offloading» и убедиться, что там стоит n_layers = -1

Приложение Text-Generation-Webui

Text-Generation-Webui — веб-интерфейс для генерации текста с использованием локальных языковых моделей, поддерживает множество моделей и кастомизацию.

Linux запуск.

start_linux.sh --api --cpu
start_linux.sh --api --cuda
start_linux.sh --api

Иконка для text-generation-webui «text-generation-webui-logo.svg» и ярлычок запуска на рабочем столе «text-generation-webui.desktop».

[Desktop Entry]
Name=Text Generation WebUI
Exec=bash -c "/media/mikl/LocalDisk/Neural-Networks/text-generation-webui/start_linux.sh --api --cpu"
Terminal=true
Type=Application
Icon=/home/mikl/programs/ollama-apps/text-generation-webui-logo.svg
StartupWMClass=TextGenerationWebUI
X-AppImage-Version=1.7.2
Comment=Text-Generation-WebUI Desktop Application
MimeType=x-scheme-handler/textgenerationwebui;
Categories=Utility;

Приложение Miniconda3

Miniconda3 — минималистичный дистрибутив Python с менеджером пакетов conda для управления окружениями и зависимостями.

Запуск на Linux.

wget https://repo.anaconda.com/miniconda/Miniconda3-py38_23.5.2-0-Linux-x86_64.sh
sudo bash ./Miniconda3-py38_23.5.2-0-Linux-x86_64.sh
conda update -n base -c defaults conda

Приложение TavernAI для Text-Generation-Webui

TavernAI для Text-Generation-Webui — расширение для Text-Generation-Webui, добавляющее удобный интерфейс для ролевых игр и чат-ботов.

Приложение Stable-Diffusion-Webui

Stable-Diffusion-Webui — популярный веб-интерфейс для локального запуска модели Stable Diffusion с множеством расширений и поддержкой LoRA.

Stable-Diffusion-Webui Git https
Stable-Diffusion-Webui Git git

Откуда берется первоначальная модель для Stable Diffusion WebUI от AUTOMATIC1111?

При первом запуске Stable Diffusion WebUI сама программа не содержит встроенной модели — её нужно скачать отдельно. Обычно для работы требуется файл модели (например, с расширением «.ckpt» или «.safetensors»), который содержит веса нейросети.

Часто рекомендуют скачивать модели с таких ресурсов, как Civitai или Huggingface. Например, в документации и обсуждениях упоминается, что можно скачать модель с Civitai напрямую и положить в папку models/Stable-diffusion внутри папки с WebUI.
Если Civitai недоступен или не работает, можно использовать альтернативные источники, например, Huggingface.

Как перенести модели и нейросети с одного ПК на другой?

Если у вас уже была установлена программа на одном из ПК и там есть скачанные модели, то:

Найдите папку с моделями на старом ПК. Обычно это: stable-diffusion-webui/models/Stable-diffusion/
Скопируйте оттуда все файлы моделей (.ckpt, .safetensors и т.п.).
Перенесите эти файлы в такую же папку на новом ПК, где установлена WebUI.
Запустите WebUI — она должна обнаружить модели и использовать их без необходимости скачивать заново.

Ссылки на .ckpt и .safetensors stable-diffusion модели.

Приложение one-click-installers

one-click-installers — скрипты и установщики для быстрого развёртывания Text-Generation-Webui и связанных инструментов.

Приложение KoboldAI или KoboldAI GIT

KoboldAI или KoboldAI GIT — платформа для интерактивного сторителлинга и генерации текста с поддержкой различных языковых моделей.

KoboldAI-Client Git https
KoboldAI-Client Git git
KoboldAI United (Экспериментальная версия) Git https
KoboldAI United (Экспериментальная версия) Git git
KoboldAI CU Git https
KoboldAI CU Git git
Colab KoboldAI GPU
Colab KoboldAI TPU

Пока Google не исправит драйвера для TPU, эта версия бесполезна.

Программа Krita

Krita — бесплатный и мощный редактор растровой графики, ориентированный на цифровую живопись и иллюстрацию.

Например.

Внедрение Diffusion в Krita.

Приложение Krita AI Diffusion

Krita AI Diffusion — плагин для Krita, позволяющий использовать модели диффузии для генерации и редактирования изображений.

Оглавление