Inhoudsopgave:
Definitie - Wat betekent Apache Lucene?
Apache Lucene is een open source-project voor een krachtige en complete bibliotheek voor tekstzoekmachines die volledig met Java is geschreven.
Het is in staat om in volledige tekst te zoeken in documenten, dus het is een technologie die geschikt is voor elke toepassing die deze functie vereist, vooral als deze platformonafhankelijk is.
Het werd voor het eerst ontwikkeld door Doug Cutting in 1999 en werd in september 2001 officieel onderdeel van de Jakarta-familie van open source Java-projecten van de Apache Foundation. Het werd in februari 2005 opgewaardeerd naar een Apache-project van topniveau.
Techopedia legt Apache Lucene uit
Apache Lucene is een krachtige zoekmachine met het concept van "een document met tekstvelden" als logische kernarchitectuur. Dit biedt een grote flexibiliteit en stelt de Lucene API in staat onafhankelijk te worden van elk bestandsformaat.
Alle tekst van formaten zoals MS Word, HTML, XML, PDF en OpenDocument kan worden geïndexeerd zolang de tekstuele informatie kan worden geëxtraheerd, wat betekent dat het niets met afbeeldingen kan doen.
Lucene is geschikt voor elke toepassing die volledige tekstindexering en zoekmogelijkheden nodig heeft, maar het wordt algemeen erkend als een geweldig hulpprogramma voor het implementeren van internetzoekmachines en voor lokaal zoeken op één site.
Kenmerken omvatten:
- Schaalbare en krachtige indexering - het kan meer dan 150 Gb per uur verwerken op moderne hardware en vereist slechts 1 Mb geheugen per hoop.
- Krachtige, nauwkeurige en efficiënte zoekalgoritmen - het biedt vele soorten krachtige zoekopdrachten, zoals zoeken op woordgroep, jokerteken, nabijheid en bereik. Het heeft ook zoeken naar en sorteren op elk veld uitgevoerd.
- Cross-platform - pure Java-implementatie en ook beschikbaar in andere programmeertalen.