Would you like me to continue translating the rest of the document? Please provide the full text and I'll translate it carefully following the specified requirements.
- For brukere av v1.2 eller tidligere: Oppgrader til v1.4 og gjenskape botene dine ved hjelp av Knowledge Base (KB). Etter en overgangsperiode, når du har bekreftet at alt fungerer som forventet med KB, fortsett med å oppgradere til v2.
- For brukere av v1.3: Selv om du allerede bruker KB, er det sterkt anbefalt å oppgradere til v1.4 og gjenskape botene dine. Hvis du fortsatt bruker pgvector, migrer ved å gjenskape botene dine ved hjelp av KB i v1.4.
- For brukere som ønsker å fortsette å bruke pgvector: Det anbefales ikke å oppgradere til v2 hvis du planlegger å fortsette å bruke pgvector. Å oppgradere til v2 vil fjerne alle ressurser relatert til pgvector, og fremtidig støtte vil ikke lenger være tilgjengelig. Fortsett å bruke v1 i dette tilfellet.
- Merk at oppgradering til v2 vil resultere i sletting av alle Aurora-relaterte ressurser. Fremtidige oppdateringer vil fokusere utelukkende på v2, med v1 som blir utfaset.
V2-oppdateringen introduserer en stor endring ved å erstatte pgvector på Aurora Serverless og ECS-basert embedding med Amazon Bedrock Knowledge Bases. Denne endringen er ikke bakoverkompatibel.
Det er flere grunner til denne endringen:
- Knowledge Bases bruker OpenSearch Serverless som backend, som muliggjør hybride søk med både fulltekst- og vektorsøk. Dette gir bedre nøyaktighet ved besvarelse av spørsmål som inneholder egennavn, noe pgvector strevde med.
- Det støtter også flere alternativer for å forbedre RAG-nøyaktighet, som avansert oppdeling og parsing.
- Knowledge Bases har vært generelt tilgjengelig i nesten ett år per oktober 2024, med funksjoner som nettcrawling allerede lagt til. Fremtidige oppdateringer forventes, noe som gjør det enklere å innføre avansert funksjonalitet på lang sikt. For eksempel, selv om dette repositoryet ikke har implementert funksjoner som import fra eksisterende S3-bøtter (en hyppig etterspurt funksjon) i pgvector, støttes dette allerede i KB (KnowledgeBases).
- Den nåværende ECS + Aurora-oppsettet er avhengig av tallrike biblioteker, inkludert de for PDF-parsing, nettcrawling og utvinning av YouTube-transkripter. Til sammenligning reduserer administrerte løsninger som Knowledge Bases vedlikeholdsbelastningen for både brukere og repositoryets utviklingsteam.
Vi anbefaler sterkt å oppgradere til v1.4 før du går over til v2. I v1.4 kan du bruke både pgvector og Knowledge Base-bots, noe som gir en overgangsperiode for å gjenskape eksisterende pgvector-bots i Knowledge Base og verifisere at de fungerer som forventet. Selv om RAG-dokumentene forblir identiske, kan backend-endringene til OpenSearch produsere noe forskjellige resultater, selv om de generelt er like, på grunn av forskjeller som k-NN-algoritmer.
Ved å sette useBedrockKnowledgeBasesForRag
til true i cdk.json
, kan du opprette bots ved hjelp av Knowledge Bases. Imidlertid vil pgvector-bots bli skrivebeskyttet, noe som forhindrer opprettelse eller redigering av nye pgvector-bots.
I v1.4 introduseres også Guardrails for Amazon Bedrock. På grunn av regionale restriksjoner for Knowledge Bases, må S3-bucketen for opplasting av dokumenter være i samme region som bedrockRegion
. Vi anbefaler å sikkerhetskopiere eksisterende dokumentbøtter før oppdatering for å unngå manuell opplasting av store mengder dokumenter senere (ettersom S3-bucket-importfunksjonalitet er tilgjengelig).
Trinnene varierer avhengig av om du bruker v1.2 eller tidligere, eller v1.3.
-
Sikkerhetskopier din eksisterende dokumentbøtte (valgfritt, men anbefalt). Hvis systemet ditt allerede er i drift, anbefaler vi sterkt dette trinnet. Ta sikkerhetskopi av bøtten ved navn
bedrockchatstack-documentbucketxxxx-yyyy
. For eksempel kan vi bruke AWS Backup. -
Oppdater til v1.4: Hent den nyeste v1.4-taggen, endre
cdk.json
, og distribuer. Følg disse trinnene:- Hent den nyeste taggen:
git fetch --tags git checkout tags/v1.4.0
- Endre
cdk.json
som følger:{ ..., "useBedrockKnowledgeBasesForRag": true, ... }
- Distribuer endringene:
npx cdk deploy
- Hent den nyeste taggen:
-
Gjenskape robotene dine: Gjenskape robotene dine på Knowledge Base med samme definisjoner (dokumenter, chunk-størrelse, osv.) som pgvector-robotene. Hvis du har et stort volum av dokumenter, vil gjenoppretting fra sikkerhetskopien i trinn 1 gjøre denne prosessen enklere. For å gjenopprette kan vi bruke gjenoppretting av tverregionale kopier. For mer detaljer, besøk her. For å spesifisere den gjenopprettede bøtten, angi
S3 Data Source
-seksjonen som følger. Mappestrukturen ers3://<bucket-name>/<user-id>/<bot-id>/documents/
. Du kan sjekke bruker-ID i Cognito-brukerpuljen og bot-ID i adresselinjen på bot-opprettingsskjermen.
Merk at noen funksjoner ikke er tilgjengelige på Knowledge Bases, som nettcrawling og YouTube-transkripststøtte (Planlegger å støtte nettcrawler (issue)). Vær også oppmerksom på at bruk av Knowledge Bases vil medføre kostnader for både Aurora og Knowledge Bases under overgangen.
-
Fjern publiserte API-er: Alle tidligere publiserte API-er må publiseres på nytt før distribusjon av v2 på grunn av VPC-sletting. For å gjøre dette må du slette de eksisterende API-ene først. Bruk av administratorens API-administrasjonsverktøy kan forenkle denne prosessen. Når slettingen av alle
APIPublishmentStackXXXX
CloudFormation-stakker er fullført, vil miljøet være klart. -
Distribuer v2: Etter lanseringen av v2, hent den merkede kilden og distribuer som følger (dette vil være mulig når den er lansert):
git fetch --tags git checkout tags/v2.0.0 npx cdk deploy
[!Advarsel] Etter distribusjon av v2 vil ALLE ROBOTER MED PREFIKSET [Ikke støttet, Kun lesning] BLI SKJULT. Sørg for å gjenskape nødvendige roboter før oppgradering for å unngå tap av tilgang.
[!Tips] Under stakkoppdateringer kan du støte på gjentatte meldinger som: Ressursbehandler returnerte melding: "Undernettverket 'subnet-xxx' har avhengigheter og kan ikke slettes." I slike tilfeller kan du navigere til Management Console > EC2 > Nettverksgrensesnitt og søke etter BedrockChatStack. Slett de viste grensesnittene som er tilknyttet dette navnet for å bidra til en jevnere distribusjonsprosess.
Som nevnt tidligere, må Knowledge Bases i v1.4 opprettes i bedrockRegion på grunn av regionale begrensninger. Derfor må du gjenskape KB. Hvis du allerede har testet KB i v1.3, gjenskaper du roboten i v1.4 med samme definisjoner. Følg trinnene som er beskrevet for v1.2-brukere.