Commit Graph

20 Commits (0eac0402e11fe0b2f16ec376e988a788d80562b9)

Author SHA1 Message Date
Ettore Di Giacinto 1d0ed95a54 feat: move other backends to grpc 1 year ago
Ettore Di Giacinto b816009db0 feat: add falcon ggllm via grpc client 1 year ago
Ettore Di Giacinto 85f0f8227d
refactor: drop code dups (#234) 2 years ago
Ettore Di Giacinto 59e3c02002
make use of new bindings for gpt4all (#232) 2 years ago
Matthew Campbell 032dee256f
Keep whisper models in memory (#233) 2 years ago
Ettore Di Giacinto 11675932ac
feat: add dolly/redpajama/bloomz models support (#214) 2 years ago
Ettore Di Giacinto f8ee20991c
feat: add bert.cpp embeddings (#222) 2 years ago
Ettore Di Giacinto c839b334eb
feat: add embeddings for go-llama.cpp backend (#190) 2 years ago
Ettore Di Giacinto 714bfcd45b
fix: missing returning error and free callback stream (#187) 2 years ago
Ettore Di Giacinto 751b7eca62
feat: add rwkv support (#158) 2 years ago
Ettore Di Giacinto 1ae7150810
feat: allow to specify default backend for model (#156) 2 years ago
Ettore Di Giacinto 156e15a4fa
Bump llama.cpp, downgrade gpt4all-j (#149) 2 years ago
Ettore Di Giacinto 92452d46da
feat: add new gpt4all-j binding (#142) 2 years ago
Ettore Di Giacinto c806eae0de
feat: config files and SSE (#83) 2 years ago
Ettore Di Giacinto f816dfae65
Add support for stablelm (#48) 2 years ago
Ettore Di Giacinto 1c4fbaae20
Add support for cerebras (#45) 2 years ago
Ettore Di Giacinto d517a54e28
Major API enhancements (#44) 2 years ago
Ettore Di Giacinto 7fec26f5d3
Enhancements (#34) 2 years ago
mudler 5556aa46dd Small refinements and refactors 2 years ago
mudler ae30bd346d Reorganize repository layout 2 years ago
mudler 93d8977ba2 Return model list 2 years ago
mudler 4a932483e1 Small fixup to template loading 2 years ago
mudler 9fb581739b Allow to template model prompts inputs 2 years ago
mudler 12eee097b7 Make it compatible with openAI api, support multiple models 2 years ago