Innehållsförteckning:
Definition - Vad betyder Apache Lucene?
Apache Lucene är ett öppen källkodsprojekt för ett högpresterande och fullständigt bibliotek för text sökmotorer som är skriven helt med Java.
Den kan söka i fulltext i dokument så det är en teknik som är lämplig för alla applikationer som kräver den här funktionen, särskilt om det är en plattform.
Det utvecklades första gången av Doug Cutting 1999 och blev officiellt en del av Apache-stiftelsens Jakarta-familj med öppna Java-projekt i september 2001. Det uppgraderades till ett Apache-projekt på toppnivå i februari 2005.
Techopedia förklarar Apache Lucene
Apache Lucene är en högpresterande sökmotor med konceptet "ett dokument som innehåller textfält" i dess logiska arkitektur. Detta ger stor flexibilitet och gör att Lucene API kan bli oberoende av vilket filformat som helst.
All text från format som MS Word, HTML, XML, PDF och OpenDocument kan indexeras så länge textinformationen kan extraheras, vilket innebär att den inte kan göra något med bilder.
Lucene är lämplig för alla applikationer som behöver en fulltextindexering och sökfunktion, men det är allmänt erkänt som ett bra verktyg för att implementera Internet-sökmotorer och för lokal sökning på en webbplats.
Funktioner inkluderar:
- Skalbar och högpresterande indexering - den kan bearbeta över 150 Gb per timme på modern hårdvara och kräver endast 1 Mb per hög med minneskrav.
- Kraftfulla, exakta och effektiva sökalgoritmer - det erbjuder många typer av kraftfulla frågor såsom fraser, jokertecken, närhet och intervallfrågor. Det har också fältets sökning och sortering efter valfritt fält.
- Cross platform - ren Java-implementering och även tillgänglig på andra programmeringsspråk.
