Commit Graph

117 Commits (master)

Author SHA1 Message Date
Ettore Di Giacinto 94817b557c
fix: make completions endpoint more close to OpenAI specification (#790) 1 year ago
Ettore Di Giacinto c71c729bc2 debug 1 year ago
Ettore Di Giacinto e459f114cd fix: fix tests, small refactors 1 year ago
Ettore Di Giacinto 982a7e86a8 feat: add huggingface embeddings backend 1 year ago
Ettore Di Giacinto 94916749c5 feat: add external grpc and model autoloading 1 year ago
Ettore Di Giacinto 1d2ae46ddc tests: clean up logs 1 year ago
Ettore Di Giacinto 3feb632eb4
refactor: rename "llama-master" and "llama" (#776) 1 year ago
Ettore Di Giacinto 6352448b72
feat: add llama-master backend (#752) 1 year ago
Ettore Di Giacinto d0e67cce75 fix: make last stream message to send empty content 1 year ago
Ettore Di Giacinto 17294ae5e5
fix: make first stream message to send empty content (#751) 1 year ago
Ettore Di Giacinto 1d0ed95a54 feat: move other backends to grpc 1 year ago
Ettore Di Giacinto 5dcfdbe51d feat: various refactorings 1 year ago
Ettore Di Giacinto f2f1d7fe72 feat: use gRPC for transformers 1 year ago
Ettore Di Giacinto ae533cadef feat: move gpt4all to a grpc service 1 year ago
Ettore Di Giacinto 58f6aab637 feat: move llama to a grpc 1 year ago
Ettore Di Giacinto b816009db0 feat: add falcon ggllm via grpc client 1 year ago
mudler dcf35dd25f Fixup custom role encoding 1 year ago
mudler e70322676c Allow to customize no action behavior 1 year ago
mudler b3f43ab938 Add a way to disable default action 1 year ago
mudler bbc4468908 Make functions more compatible with OpenAI specs 1 year ago
mudler 55befe396a Add grammar_json to the request parameters to facilitate JSON generation 1 year ago
mudler 483fddccf9 minor fixups 1 year ago
mudler 05aed255db Customize function call in templates 1 year ago
mudler 0f1326b2bd fixups 1 year ago
mudler b722e7eb7e feat: cleanups, small enhancements 1 year ago
mudler f09ddd2983 feat: add grammar and functions call support 1 year ago
Luis López a6839fd238
feat: [whisper] Partial support for verbose_json format in transcribe endpoint (#721) 1 year ago
Ettore Di Giacinto 3593cb0c87
feat: update llama, enable NUMA (#684) 2 years ago
Ettore Di Giacinto 02136531a3
fix: return index and delta in stream token (#680) 2 years ago
Ettore Di Giacinto d3a486a4f8
feat: Add '/version' endpoint and display it in the CLI (#679) 2 years ago
Ettore Di Giacinto 2b957df56c
fix: rename /models/list to /models/available (#678) 2 years ago
Ettore Di Giacinto 78f3c3da48
refactor: consolidate usage of GetURI (#674) 2 years ago
Ettore Di Giacinto 60db5957d3
Gallery repository (#663) 2 years ago
Ettore Di Giacinto a7bb029d23
feat: add tts with go-piper (#649) 2 years ago
Ettore Di Giacinto 2f5feb4841
Add LowVRAM option parameter (#642) 2 years ago
Ettore Di Giacinto 295f3030a9
feat: add typical_p to model parameters (#598) 2 years ago
Ettore Di Giacinto 10ddd72b58
fix: set default batch size (#597) 2 years ago
Ettore Di Giacinto e37361985c
deps: update gpt4all bindings, fix search path on new versions (#592) 2 years ago
Ettore Di Giacinto 84946e9275
feat: display download progress when installing models (#543) 2 years ago
Ettore Di Giacinto c9bbba4872
tests: add llama tests with openllama (#538) 2 years ago
Ettore Di Giacinto 5abbb134d9
feat: extend model configuration for llama.cpp (#536) 2 years ago
Ettore Di Giacinto d62aef2016
feat: add experimental support for falcon-7b (#516) 2 years ago
Ettore Di Giacinto b503725dc7
fix: downgrade gpt4all (#503) 2 years ago
Samuel Maynard 96794851b3
feat: add support for `Stream: true` to completionEndpoint (#465) 2 years ago
Ettore Di Giacinto 78ad4813df
feat: Update gpt4all, support multiple implementations in runtime (#472) 2 years ago
Aisuko c8a4a4f4e9
feat: Add new test cases for LoadConfigs (#447) 2 years ago
Pavel Zloi 3ba07a5928
feat: add LangChainGo Huggingface backend (#446) 2 years ago
Aisuko 49ce24984c
feat: Add more test-cases and remove dev container (#433) 2 years ago
Ettore Di Giacinto f401181cb5
fix: switch back to upstream for rwkv bindings (#432) 2 years ago
Ettore Di Giacinto aacb96df7a
fix: correctly handle errors from App constructor (#430) 2 years ago