Commit Graph

57 Commits (master)

Author SHA1 Message Date
Ettore Di Giacinto c71c729bc2 debug 1 year ago
Ettore Di Giacinto 94916749c5 feat: add external grpc and model autoloading 1 year ago
Ettore Di Giacinto 47cc95fc9f feat: add all backends to autoload 1 year ago
Ettore Di Giacinto 3feb632eb4
refactor: rename "llama-master" and "llama" (#776) 1 year ago
Ettore Di Giacinto 236497e331
feat: resolve JSONSchema refs (planners) (#774) 1 year ago
Ettore Di Giacinto 6352448b72
feat: add llama-master backend (#752) 1 year ago
Ettore Di Giacinto 1d0ed95a54 feat: move other backends to grpc 1 year ago
Ettore Di Giacinto 5dcfdbe51d feat: various refactorings 1 year ago
Ettore Di Giacinto f2f1d7fe72 feat: use gRPC for transformers 1 year ago
Ettore Di Giacinto ae533cadef feat: move gpt4all to a grpc service 1 year ago
Ettore Di Giacinto 58f6aab637 feat: move llama to a grpc 1 year ago
Ettore Di Giacinto b816009db0 feat: add falcon ggllm via grpc client 1 year ago
mudler 55befe396a Add grammar_json to the request parameters to facilitate JSON generation 1 year ago
mudler c0578031b5 Add tests 1 year ago
mudler b722e7eb7e feat: cleanups, small enhancements 1 year ago
mudler f09ddd2983 feat: add grammar and functions call support 1 year ago
Luis López a6839fd238
feat: [whisper] Partial support for verbose_json format in transcribe endpoint (#721) 1 year ago
Ettore Di Giacinto bf5acf646e
fix: adapt whisper to bindings updates (#702) 2 years ago
Ettore Di Giacinto 78f3c3da48
refactor: consolidate usage of GetURI (#674) 2 years ago
mudler d18f85df46 fix: add tags 2 years ago
Ettore Di Giacinto 6213da330a
fix: add omitempty where needed (#671) 2 years ago
Ettore Di Giacinto 60db5957d3
Gallery repository (#663) 2 years ago
Ettore Di Giacinto a7bb029d23
feat: add tts with go-piper (#649) 2 years ago
Ettore Di Giacinto e37361985c
deps: update gpt4all bindings, fix search path on new versions (#592) 2 years ago
Ettore Di Giacinto 84946e9275
feat: display download progress when installing models (#543) 2 years ago
Ettore Di Giacinto d62aef2016
feat: add experimental support for falcon-7b (#516) 2 years ago
Ettore Di Giacinto b447a2a719
feat: support upscaled image generation with esrgan (#509) 2 years ago
Ettore Di Giacinto 78ad4813df
feat: Update gpt4all, support multiple implementations in runtime (#472) 2 years ago
Pavel Zloi 3ba07a5928
feat: add LangChainGo Huggingface backend (#446) 2 years ago
Ettore Di Giacinto 9decd0813c
feat: update go-gpt2 (#359) 2 years ago
Ettore Di Giacinto 05a3d569b0
feat: allow to override model config (#323) 2 years ago
Ettore Di Giacinto 1fade53a61
feat: minor enhancements to /models/apply (#297) 2 years ago
Ettore Di Giacinto cc9aa9eb3f
feat: add /models/apply endpoint to prepare models (#286) 2 years ago
Ettore Di Giacinto 9d051c5d4f
feat: add image generation with ncnn-stablediffusion (#272) 2 years ago
Ettore Di Giacinto 2a9d7474ce
fix(rwkv): load tokenizer file from model path (#255) 2 years ago
Ettore Di Giacinto 8250391e49
Add support for gptneox/replit (#238) 2 years ago
Ettore Di Giacinto fd1df4e971
whisper: add tests and allow to set upload size (#237) 2 years ago
Ettore Di Giacinto 4413defca5
feat: add starcoder (#236) 2 years ago
Ettore Di Giacinto 85f0f8227d
refactor: drop code dups (#234) 2 years ago
Ettore Di Giacinto 59e3c02002
make use of new bindings for gpt4all (#232) 2 years ago
Matthew Campbell 032dee256f
Keep whisper models in memory (#233) 2 years ago
Ettore Di Giacinto 11675932ac
feat: add dolly/redpajama/bloomz models support (#214) 2 years ago
Ettore Di Giacinto f8ee20991c
feat: add bert.cpp embeddings (#222) 2 years ago
Ettore Di Giacinto 9f426578cf
feat: add transcript endpoint (#211) 2 years ago
Ettore Di Giacinto c839b334eb
feat: add embeddings for go-llama.cpp backend (#190) 2 years ago
Ettore Di Giacinto 714bfcd45b
fix: missing returning error and free callback stream (#187) 2 years ago
Ettore Di Giacinto 751b7eca62
feat: add rwkv support (#158) 2 years ago
Ettore Di Giacinto 1ae7150810
feat: allow to specify default backend for model (#156) 2 years ago
Ettore Di Giacinto 156e15a4fa
Bump llama.cpp, downgrade gpt4all-j (#149) 2 years ago
Ettore Di Giacinto 92452d46da
feat: add new gpt4all-j binding (#142) 2 years ago