LLMQnA tarnybos konfigūravimo parametrai
Metadata
Apibrėžia metaduomenų nustatymus, įskaitant filtravimo sąlygas.
Metaduomenys gali būti naudojami šiais atvejais:
- pridedant failą su konkrečiais metaduomenimis į žinių bazę, kad būtų galima filtruoti failo turinį (žr. 2 ir 3 naudojimo atvejus),
- kai ieškoma teksto tik tuose segmentuose / failuose, kuriuose yra nurodyti metaduomenys,
- kai bendraujant su asistentu turi būti naudojami tik tie segmentai / failai, kuriuose yra nurodyti metaduomenys.
"Metadata":{"shop":"true","services":"true","and_or":"and","exclude":{"ChunkNr":"8","public":"true"}}
- Failų paieškai metažymų reikšmės gali būti sąrašai.
- Filtrai pagal numatytuosius parametrus sujungiami loginiu operatoriumi „or“. Norėdami naudoti operatorių „and“, jį turite nurodyti metažyma „and_or“ (ši žyma yra nebūtina).
- „Markdown“ kontekstiniuose failuose simboliai
#,##ir###interpretuojami kaip teksto segmentų skyrikliai, o junginiai su tekstu (# xxx,## yyyir### zzz) į metaduomenis įtraukiami kaipH1:xxx,H2:yyyirH3:zzz. Eilutė, kurioje yra#### somekey:somevalue, į metaduomenis įtraukiama kaipsomekey:somevalue, o eilutė, kurioje yra tik simboliai####, reiškia privalomą segmento lūžį.
Threshold
Kosinuso panašumas naudojamas norint nustatyti panašumo slenkstį tarp vartotojo įvesto teksto ir žinių bazės segmentų, atmetant segmentus, kurie viršija nurodytą reikšmę. Kosinuso panašumo reikšmė gali būti nuo 0.0 iki 2.0. Kuo skaičius mažesnis, tuo segmentai panašesni.
"Similarity":{"metric":"cosine_sim","threshold":"0.75"}
Debug
Įjungia arba išjungia derinimo režimą. (Jei reikšmė yra „true“, metodui chat į LLM su raktu LLMinput perduodama visa užklausa su kontekstu ir istorija, o su raktu history – pokalbio istorija).
"Debug":"true"
LLM
Nurodo alternatyvų kalbos modelį, kuris naudojamas, jei tarnyba paleidžiama su dviem galimais modeliais – „gpt-35-turbo“ ir „gpt-4o“. (Jei paleidžiant tarnybą alternatyvus modelis nenurodomas, ši parinktis yra neveiksni.)
"LLM":"gpt-4o"
DifferentLLM
Apibrėžia kitą LLM modelį.
"DifferentLLM":{"model":"gpt-4o","version":"xxx", "azure_deployment":"xxx", "azure_endpoint":"[https://xxx.openai.azure.com/](https://xxx.openai.azure.com/)","api_key":"xxx"}
UseKeywords
Reikšmės: „true“ arba „false“ (numatytoji reikšmė yra „true“). Įgalina paiešką ir filtravimą pagal raktinius žodžius, papildant semantinę paiešką segmentų atrankoje ir filtravime.
"UseKeywords":"true"
Language
Nurodo raktinių žodžių apdorojimo kalbą.
"Language":"en"
HyDe (eksperimentinis)
Leidžia naudoti hipotetinį dokumentą, kuris gali padėti geriau suprasti užklausą. Reikšmė gali būti „true“ arba „false“ (numatytoji reikšmė yra „false“). Kai nustatyta reikšmė „true“, informacija pirmiausia generuojama naudojant LLM, kuris gali padėti atsakyti į klausimą. Tada iš vektorių duomenų bazės atrenkami semantiniu požiūriu į šį hipotetinį sugeneruotą segmentą panašūs segmentai, o ne į klausimą panašūs segmentai.
"HyDe":"true"
ChunkSize
Failų skaidymo metu sukurto segmento dydis. Apibrėžia, kokio dydžio turi būti failų segmentai, kai failai skaidomi apdorojimui.
"ChunkSize":"1024"
SmartChunking
Pagal įvairius teksto požymius (pvz., sąrašus, pastraipas ir kitus elementus) nustatoma kito segmento pradžia. Pagal numatytuosius parametrus ši parinktis yra įjungta, kai nustatyta reikšmė „true“.
"SmartChunking":"false"
FilterReferences
Nuorodų filtravimas. Leidžia filtruoti nuorodas apdorotame turinyje. Kai nustatyta reikšmė „true“ (numatytoji reikšmė yra „false“), grąžinamos tik tos nuorodos, kurios, remiantis kosinuso panašumu, yra semantiškai panašios į atsakymą. Nuorodos, kurios nebuvo panaudotos atsakymo generavimui, nėra įtraukiamos.
"FilterReferences":"true"
MultiQuestions (eksperimentinis)
Jei neįmanoma atsakyti į klausimą, užklausą suskaidoma į kelis klausimus, ir į juos atsakoma atskirai. Parametras užtikrina, kad esant itin sudėtingam, kompleksiškam klausimui, jis būtų suskaidytas į siauresnes užklausas, kad būtų gauti geresni rezultatai. Kai nustatyta reikšmė „true“ (numatytoji reikšmė yra „false“), ir kontekste nebus pakankamai informacijos atsakymui sugeneruoti, LLM suskaidys įvestį į kelias dalis ir atsakys į kiekvieną dalį atskirai.
"MultiQuestions":"true"
ExtractPictures
Ištraukia vaizdus iš PDF failų į atskirą aplanką. Parametras užtikrina, kad PDF failuose esantys vaizdai būtų išsaugoti atskirai. Metodas getpictures vėliau automatiškai išsaugo visus vaizdus rodinyje „Ištekliai“ ir sukuria nuorodas žinių bazės dokumente kaip nuorodas į virtualiojo asistento išteklių aplanką.
"ExtractPictures":"true"
UseSummary (eksperimentinis)
Sukuria failo santrauką ir prideda ją prie segmento metaduomenų, taip pat prieš failo segmentus, kai ruošiamas atsakymo kontekstas. Santrauka sukuriama iš failo turinio ir pridedama prie atsakymo konteksto.
"UseSummary":"true"
Pdf2md
Nurodo įrankį, kuris naudojamas PDF konvertavimui į markdown formatą. Naudojama metodams getfilecontent ir addfile.
- type (įrankiai pasiekiami per API iškvietimus: „gemini“, „llamacloudparse“, „docintelligence“, „mistral“ arba naudojant „Python“ bibliotekas: „markerpdf“, „pymupdf4llm“, „docling“)
- model (tik jei tipas yra „gemini“ arba „mistral“)
- key (tik jei tipas yra „gemini“, „llamacloudparse“, „docintelligence“ arba „mistral“). API iškvietimams reikalingi prieigos raktai, kuriuos galima gauti iš atitinkamų paslaugų teikėjų:
- gemini – iš https://aistudio.google.com/app/apikey
- mistral – iš https://admin.mistral.ai/organization/api-keys
- llamacloudparse – iš https://cloud.llamaindex.ai/
- docintelligence – iš https://azure.microsoft.com/en-us/products/ai-services/ai-document-intelligence
- endpoint (tik jei tipas yra „docintelligence“)
config parametro pavyzdžiai (jei „ExtractPictures“ reikšmė yra „true“, vaizdai iš PDF failo išsaugomi kaip atskiri failai ir gali būti gaunami naudojant metodą getPictures):
{"ExtractPictures":"true","Pdf2md":{"type":"gemini","model":"gemini-2.0-flash","key":"<GOOGLE_API_KEY>"}}
{"Pdf2md":{"type":"llamacloudparse","key":"<LLAMA_CLOUD_API_KEY>"}}
{"ExtractPictures":"true","Pdf2md":{"type":"mistral","model":"mistral-ocr-latest","key":"<MISTRAL_API_KEY>"}}
{"ExtractPictures":"true","Pdf2md":{"type":"docintelligence","endpoint":"<AZURE_DOCINTELLIGENCE_ENDPOINT>","key":"<AZURE_DOCINTELLIGENCE_KEY>"}}
{"ExtractPictures":"true","Pdf2md":{"type":"markerpdf"}}
{"ExtractPictures":"true","Pdf2md":{"type":"pymupdf4llm"}}
{"ExtractPictures":"true","Pdf2md":{"type":"docling"}}