Independent Project Not affiliated with, sponsored by, or endorsed by the Watch Tower Bible and Tract Society or Jehovah's Witnesses.
jw-agent-toolkit
ES

Guide

Concordancia exacta NWT + publicaciones

Búsqueda literal sobre tu corpus local descifrado (NWT, JWPUB, EPUB). Complementa el RAG semántico — no lo reemplaza.

Cuándo usar concordancia y cuándo RAG

PreguntaHerramienta
¿Dónde aparece exactamente la frase “conocimiento exacto”?jw grep "\"conocimiento exacto\""
¿Qué versículos hablan sobre el conocimiento?jw rag "qué dice la Biblia sobre el conocimiento"
¿Cuántas veces aparece “Jehová” en el NT?jw grep "Jehová" --kind nwt --max 500

Construir el índice

# Indexar un archivo concreto
jw grep --build-index ~/jw-publications/w24.jwpub --language es

# Indexar una carpeta entera (recursivo)
jw grep --build-index ~/jw-publications --language es --recursive

# Ingerir un capítulo NWT desde WOL (red sólo en este paso)
jw grep --build-nwt "Juan 3" --language es

# Forzar re-indexación de un archivo modificado
jw grep --build-index w24.jwpub --language es --force

# Ver estadísticas
jw grep --stats

El índice vive en ~/.jw-agent-toolkit/concordance.db (override con JW_CONCORDANCE_DB). Es SQLite WAL — abierto en lectura por múltiples procesos sin bloqueo.

Gramática de consultas

Soporta la sintaxis nativa FTS5 (no regex):

OperadorEjemploSignificado
Phrase"reino de Dios"Frase exacta
ANDJehová amorAmbos términos (orden libre)
OR"reino de Dios" OR "reino del cielo"Cualquiera
NOTJehová NOT espírituExcluir
NEARJehová NEAR/3 amorDistancia ≤ 3 tokens
Prefixinteli*”inteligente”, “inteligencia”…

Diacríticos

El tokenizador es unicode61 remove_diacritics 2busca "espiritu" y encuentras "Espíritu" (y viceversa). Esto vale en español/portugués/inglés. Si necesitas búsqueda sensible a acentos, abre un issue.

Sin regex

\b, [abc], +, ^, $ y compañía no funcionan — el comando se rehúsa con un mensaje claro. Para variantes morfológicas usa el RAG semántico.

Filtros

jw grep "amó" --language es
jw grep "amó" --kind nwt          # sólo Biblia
jw grep "amó" --kind jwpub        # sólo publicaciones
jw grep "amó" --max 200           # techo de resultados

API Python

from jw_core.concordance import build_index, concordance_search
from pathlib import Path

build_index(
    paths=[Path("~/jw-publications/w24.jwpub").expanduser()],
    language="es",
)
hits = concordance_search('"conocimiento exacto"', language="es")
for h in hits:
    print(h.ref, "→", h.snippet, "·", h.url or "(sin URL canónica)")

MCP tools

  • concordance_build_index(paths, language, force){inserted, files} ó {error}.
  • concordance_search(query, language?, source_kind?, max_results?){hits: [...]} ó {error}.

Limitaciones conocidas

  • No indexa fuentes Obsidian (Fase 20) — pendiente.
  • No persiste el contexto antes/después del párrafo — sólo el párrafo en sí. Si quieres más contexto, abre el url en navegador.
  • El tamaño del índice crece linealmente con el corpus. ~50 MB cada 25 publicaciones.

La DB queda sólo en tu máquina. Nada se sube. Las publicaciones siguen siendo propiedad de Watch Tower Bible and Tract Society — el toolkit solo facilita búsqueda offline sobre el material que ya tienes legalmente descargado.

Edit this page on docs/guias/concordancia-exacta.md