AddEmbeddings
Lägger till två inbäddningsvektorer och returnerar resultat som en normaliserad vektor.
Format
AddEmbeddings ( v1 ; v2 )
Parametrar
v1
och v2
– ett textuttryck, textfält eller containerfält som innehåller inbäddningsvektorer med samma dimensioner.
Returnerad datatyp
text, container
Ursprungsversion
22.0
Beskrivning
Den här funktionen utför vektoraddition på två inbäddningsvektorer och returnerar resultatet som en normaliserad vektor. Normalisering fokuserar den resulterande vektorn på dess semantiska riktning snarare än dess storlek, vilket är standardpraxis för att jämföra eller manipulera inbäddningar.
Använd den här funktionen för att kombinera den semantiska betydelsen av två begrepp som representeras av vektorer. Om man till exempel adderar vektorn för ”jag gillar hundar” och vektorn för ”jag gillar katter” kan det resultera i en vektor som representerar ett begrepp som snarare motsvarar ”jag gillar husdjur” eller ”jag gillar både hundar och katter”. Det kan vara användbart i semantisk sökning för att bredda begrepp eller i dataanalys för att hitta aggregerade betydelser.
Om v1
och v2
är text måste de vara i form av JSON-matriser. Vanligtvis förbättras prestanda om man använder inbäddningsvektorer som binära containerdata.
Kommentarer
-
Inbäddningsvektorer måste genereras från samma modell för att säkerställa kompatibilitet och prestanda. Det går inte att blanda inbäddningsvektorer från olika modeller.
-
Den här funktionen returnerar ”?” i följande fall:
-
Om
v1
ochv2
har olika dimensioner -
Om resultatet är en nollvektor (vilket kan hända om v1 och v2 är identiska men har motsatta tecken), eftersom funktionen inte kan normalisera en nollvektor
-
Exempel 1
AddEmbeddings ( "[1, 2, 3]" ; "[4, 5, 6]" )
returnerar [0,40160966445124940405, 0,56225353023174917677, 0,722897396012249005]. Additionen är [1+4, 2+5, 3+6] = [5, 7, 9]. Funktionen normaliserar sedan vektorn och returnerar den som en JSON-matris eftersom båda indata var text.
Exempel 2
AddEmbeddings ( Produkter::Smartphone_Inbäddning ; Produkter::Premium_Inbäddning )
returnerar containerdata för den normaliserade vektorn som representerar det kombinerade begreppet ”premium smartphone”.
I det här exemplet antas fältet Produkter::Smartphone_Inbäddning innehålla inbäddningsvektorn för texten ”smartphone” och Produkter::Premium_Inbäddning innehåller inbäddningsvektorn för texten ”premium”. Den resulterande vektorn skulle kunna användas med Scriptsteget Utför semantisk sökning för att hitta produktbeskrivningar som är semantiskt nära det kombinerade begreppet.