Commit Graph

20 Commits (c4495ad8f2a96a83aadf341b51c1f582757853e8)

Author SHA1 Message Date
mudler f09ddd2983 feat: add grammar and functions call support 1 year ago
Ettore Di Giacinto 3593cb0c87
feat: update llama, enable NUMA (#684) 1 year ago
Ettore Di Giacinto 60db5957d3
Gallery repository (#663) 1 year ago
Ettore Di Giacinto 2f5feb4841
Add LowVRAM option parameter (#642) 1 year ago
Ettore Di Giacinto 295f3030a9
feat: add typical_p to model parameters (#598) 1 year ago
Ettore Di Giacinto 5abbb134d9
feat: extend model configuration for llama.cpp (#536) 1 year ago
Aisuko c8a4a4f4e9
feat: Add new test cases for LoadConfigs (#447) 1 year ago
Ettore Di Giacinto 217dbb448e
feat: allow to set a prompt cache path and enable saving state (#395) 1 year ago
Ettore Di Giacinto cc9aa9eb3f
feat: add /models/apply endpoint to prepare models (#286) 1 year ago
Ettore Di Giacinto 9d051c5d4f
feat: add image generation with ncnn-stablediffusion (#272) 1 year ago
Ettore Di Giacinto acd03d15f2
feat: add support for cublas/openblas in the llama.cpp backend (#258) 1 year ago
Ettore Di Giacinto 85f0f8227d
refactor: drop code dups (#234) 1 year ago
Ettore Di Giacinto 89dfa0f5fc
feat: add experimental support for embeddings as arrays (#207) 1 year ago
mudler 009ee47fe2 Don't allow 0 as thread count 1 year ago
mudler e73283121b feat: support arrays for prompt and input 1 year ago
Ettore Di Giacinto 961cf29217
feat: expose mirostat to config (#193) 1 year ago
Ettore Di Giacinto c839b334eb
feat: add embeddings for go-llama.cpp backend (#190) 1 year ago
Ettore Di Giacinto 1ae7150810
feat: allow to specify default backend for model (#156) 1 year ago
Ettore Di Giacinto 52f4d993c1
feat: add /edit endpoint (#119) 1 year ago
Ettore Di Giacinto c806eae0de
feat: config files and SSE (#83) 1 year ago