Fase 33
embed-rerank
Núcleo RAG al SOTA multilingüe
Reemplaza el FakeEmbedder por proveedores reales con auto-detección triple-target (API/MLX/NVIDIA/CPU) + cross-encoder reranker después del RRF. NDCG@10 sube significativamente en es/en/pt.
Qué se entregó
- 6 embedders: BGE-M3, Multilingual-E5, Jina v3, Cohere v3, Voyage, Ollama nomic.
- 3 rerankers: BGE-reranker-v2-m3 (local Apache 2.0), Cohere Rerank 3.5, Jina Reranker v2.
- VectorStore.hybrid_search(rerank=True) con backwards-compat completa.
- Auto-detect: API → MLX → NVIDIA → CPU según JW_EMBED_PROVIDER / JW_RERANK_PROVIDER.
- Tests cross-provider con stub SDK vía sys.modules — cero red.
Pendiente / siguiente PR
- Métricas NDCG sobre corpus mayor con eval comparativo.