Ettore Di Giacinto
c71c729bc2
debug
1 year ago
Ettore Di Giacinto
94916749c5
feat: add external grpc and model autoloading
1 year ago
Ettore Di Giacinto
47cc95fc9f
feat: add all backends to autoload
...
Now since gRPCs are not crashing the main thread we can just greedly
attempt all the backends we have available.
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
3feb632eb4
refactor: rename "llama-master" and "llama" ( #776 )
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
236497e331
feat: resolve JSONSchema refs (planners) ( #774 )
1 year ago
Ettore Di Giacinto
6352448b72
feat: add llama-master backend ( #752 )
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
1d0ed95a54
feat: move other backends to grpc
...
This finally makes everything more consistent
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
5dcfdbe51d
feat: various refactorings
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
f2f1d7fe72
feat: use gRPC for transformers
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
ae533cadef
feat: move gpt4all to a grpc service
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
58f6aab637
feat: move llama to a grpc
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
Ettore Di Giacinto
b816009db0
feat: add falcon ggllm via grpc client
...
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
1 year ago
mudler
55befe396a
Add grammar_json to the request parameters to facilitate JSON generation
2 years ago
mudler
c0578031b5
Add tests
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
mudler
b722e7eb7e
feat: cleanups, small enhancements
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
mudler
f09ddd2983
feat: add grammar and functions call support
2 years ago
Luis López
a6839fd238
feat: [whisper] Partial support for verbose_json format in transcribe endpoint ( #721 )
2 years ago
Ettore Di Giacinto
bf5acf646e
fix: adapt whisper to bindings updates ( #702 )
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
Ettore Di Giacinto
78f3c3da48
refactor: consolidate usage of GetURI ( #674 )
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
mudler
d18f85df46
fix: add tags
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
Ettore Di Giacinto
6213da330a
fix: add omitempty where needed ( #671 )
2 years ago
Ettore Di Giacinto
60db5957d3
Gallery repository ( #663 )
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
Ettore Di Giacinto
a7bb029d23
feat: add tts with go-piper ( #649 )
...
Signed-off-by: mudler <mudler@localai.io>
2 years ago
Ettore Di Giacinto
e37361985c
deps: update gpt4all bindings, fix search path on new versions ( #592 )
2 years ago
Ettore Di Giacinto
84946e9275
feat: display download progress when installing models ( #543 )
2 years ago
Ettore Di Giacinto
d62aef2016
feat: add experimental support for falcon-7b ( #516 )
...
Signed-off-by: mudler <mudler@mocaccino.org>
2 years ago
Ettore Di Giacinto
b447a2a719
feat: support upscaled image generation with esrgan ( #509 )
2 years ago
Ettore Di Giacinto
78ad4813df
feat: Update gpt4all, support multiple implementations in runtime ( #472 )
...
Signed-off-by: mudler <mudler@mocaccino.org>
2 years ago
Pavel Zloi
3ba07a5928
feat: add LangChainGo Huggingface backend ( #446 )
...
Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
2 years ago
Ettore Di Giacinto
9decd0813c
feat: update go-gpt2 ( #359 )
...
Signed-off-by: mudler <mudler@mocaccino.org>
2 years ago
Ettore Di Giacinto
05a3d569b0
feat: allow to override model config ( #323 )
2 years ago
Ettore Di Giacinto
1fade53a61
feat: minor enhancements to /models/apply ( #297 )
2 years ago
Ettore Di Giacinto
cc9aa9eb3f
feat: add /models/apply endpoint to prepare models ( #286 )
2 years ago
Ettore Di Giacinto
9d051c5d4f
feat: add image generation with ncnn-stablediffusion ( #272 )
2 years ago
Ettore Di Giacinto
2a9d7474ce
fix(rwkv): load tokenizer file from model path ( #255 )
2 years ago
Ettore Di Giacinto
8250391e49
Add support for gptneox/replit ( #238 )
2 years ago
Ettore Di Giacinto
fd1df4e971
whisper: add tests and allow to set upload size ( #237 )
2 years ago
Ettore Di Giacinto
4413defca5
feat: add starcoder ( #236 )
2 years ago
Ettore Di Giacinto
85f0f8227d
refactor: drop code dups ( #234 )
2 years ago
Ettore Di Giacinto
59e3c02002
make use of new bindings for gpt4all ( #232 )
2 years ago
Matthew Campbell
032dee256f
Keep whisper models in memory ( #233 )
2 years ago
Ettore Di Giacinto
11675932ac
feat: add dolly/redpajama/bloomz models support ( #214 )
2 years ago
Ettore Di Giacinto
f8ee20991c
feat: add bert.cpp embeddings ( #222 )
2 years ago
Ettore Di Giacinto
9f426578cf
feat: add transcript endpoint ( #211 )
2 years ago
Ettore Di Giacinto
c839b334eb
feat: add embeddings for go-llama.cpp backend ( #190 )
2 years ago
Ettore Di Giacinto
714bfcd45b
fix: missing returning error and free callback stream ( #187 )
2 years ago
Ettore Di Giacinto
751b7eca62
feat: add rwkv support ( #158 )
...
Signed-off-by: mudler <mudler@mocaccino.org>
2 years ago
Ettore Di Giacinto
1ae7150810
feat: allow to specify default backend for model ( #156 )
...
Signed-off-by: mudler <mudler@c3os.io>
2 years ago
Ettore Di Giacinto
156e15a4fa
Bump llama.cpp, downgrade gpt4all-j ( #149 )
2 years ago
Ettore Di Giacinto
92452d46da
feat: add new gpt4all-j binding ( #142 )
2 years ago