Cải thiện khả năng nhớ ngữ cảnh trong Tạo ra Tăng cường Tìm kiếm

thứ sáu, tháng 11 22, 2024 12:00 AM
2,604

Tạo ra tăng cường tìm kiếm (RAG) đã nổi lên như một phương pháp quan trọng để tích hợp các mô hình ngôn ngữ lớn (LLMs) vào các ứng dụng kinh doanh chuyên biệt, cho phép tích hợp dữ liệu độc quyền vào các phản hồi của mô hình. Mặc dù hiệu quả trong giai đoạn thử nghiệm (POC), các nhà phát triển thường gặp phải sự sụt giảm độ chính xác đáng kể khi chuyển RAG vào sản xuất. Vấn đề này đặc biệt rõ ràng trong giai đoạn tìm kiếm, nơi mục tiêu là lấy chính xác ngữ cảnh liên quan nhất cho một truy vấn nhất định, một chỉ số được gọi là khả năng nhớ ngữ cảnh. Bài viết này đi sâu vào các chiến lược để cải thiện khả năng nhớ ngữ cảnh bằng cách tùy chỉnh và tinh chỉnh các mô hình nhúng, cuối cùng cải thiện hiệu suất của RAG trong các ứng dụng thực tế.

RAG hoạt động trong hai bước chính: tìm kiếm và tạo ra. Trong giai đoạn tìm kiếm, mô hình chuyển đổi văn bản thành các vector, lập chỉ mục, truy xuất và xếp hạng lại các vector này để xác định các kết quả hàng đầu. Tuy nhiên, các thất bại trong giai đoạn này có thể dẫn đến việc bỏ lỡ các ngữ cảnh liên quan, dẫn đến khả năng nhớ ngữ cảnh thấp hơn và các đầu ra tạo ra ít chính xác hơn. Một giải pháp hiệu quả là điều chỉnh mô hình nhúng, được thiết kế để hiểu mối quan hệ giữa dữ liệu văn bản, để tạo ra các nhúng cụ thể cho tập dữ liệu đang được sử dụng. Việc tinh chỉnh này cho phép mô hình tạo ra các vector tương tự cho các câu tương tự, nâng cao khả năng truy xuất ngữ cảnh rất liên quan đến truy vấn.

Để cải thiện khả năng nhớ ngữ cảnh, điều cần thiết là chuẩn bị một tập dữ liệu tùy chỉnh phản ánh các loại truy vấn mà mô hình sẽ gặp phải. Điều này bao gồm việc trích xuất một loạt các câu hỏi đa dạng từ cơ sở tri thức, diễn đạt lại chúng để tạo sự biến đổi, và tổ chức chúng theo mức độ liên quan. Ngoài ra, việc xây dựng một tập dữ liệu đánh giá giúp đánh giá hiệu suất của mô hình trong một môi trường thực tế. Bằng cách sử dụng một Đánh giá viên Tìm kiếm Thông tin, các nhà phát triển có thể đo lường các chỉ số như Recall@k và Precision@k để đánh giá độ chính xác của việc truy xuất. Cuối cùng, việc tinh chỉnh mô hình nhúng có thể dẫn đến những cải thiện đáng kể trong khả năng nhớ ngữ cảnh, đảm bảo rằng RAG vẫn chính xác và đáng tin cậy trong các môi trường sản xuất.

Related News

Tầm Nhìn của 4EVERLAND cho Năm 2025: Nâng Cao Web3 Thông Qua Đổi Mới cover
3 ngày trước
Tầm Nhìn của 4EVERLAND cho Năm 2025: Nâng Cao Web3 Thông Qua Đổi Mới
Khi chúng ta bước vào năm 2025, 4EVERLAND sẵn sàng tăng cường cam kết của mình trong việc trao quyền cho các nhà phát triển Web3 và cộng đồng toàn cầu thông qua công nghệ phi tập trung đổi mới. Dựa trên những thành công của năm 2024, bao gồm việc mở rộng quan hệ đối tác với các giao thức hàng đầu và ra mắt các dịch vụ AI tiên tiến, 4EVERLAND tập trung vào việc cung cấp cơ sở hạ tầng tiên tiến hỗ trợ hệ sinh thái Web3. Năm tới hứa hẹn sẽ mang tính chuyển đổi, với sứ mệnh rõ ràng là nâng cao các dịch vụ và thúc đẩy cách tiếp cận cộng đồng khi công ty tiếp tục BUIDL. Trong quý đầu tiên, 4EVERLAND sẽ giới thiệu nền tảng tổng hợp 4EVERBoost, được thiết kế như một giải pháp ra mắt Dapp một điểm đến cho các nhà phát triển Web3. Nền tảng này nhằm đơn giản hóa quy trình triển khai ứng dụng, cho phép các nhà phát triển tối ưu hóa quy trình làm việc và tiếp cận đối tượng mục tiêu một cách hiệu quả. Thêm vào đó, công ty dự định tăng cường quan hệ đối tác với các nhân tố chính như zkSync, Arbitrum và Optimism, nâng cao khả năng tương tác của giao thức để cải thiện trải nghiệm tổng thể của nhà phát triển và thu hút nhiều dự án hơn đến nền tảng 4EVERLAND. Khi năm trôi qua, 4EVERLAND sẽ ra mắt một thị trường mô hình AI phi tập trung trong quý hai, tạo điều kiện tích hợp liền mạch các nguồn tài nguyên tính toán AI cho các nhà phát triển. Sự ra mắt của AI Worker sẽ đơn giản hóa hơn nữa việc triển khai các mô hình AI quy mô lớn. Trong quý ba, phiên bản mở của Mạng Node 4EVER sẽ cho phép các thành viên cộng đồng đóng góp các nguồn tài nguyên nhàn rỗi, nâng cao khả năng mở rộng và độ tin cậy. Cuối cùng, quý bốn sẽ chứng kiến sự hình thành của một DAO, cho phép các chủ sở hữu token tham gia vào quản trị, từ đó tăng cường tính minh bạch và sự tham gia của cộng đồng trong các quy trình ra quyết định. Tổng thể, năm 2025 hứa hẹn sẽ là một năm đổi mới và hợp tác cho 4EVERLAND, củng cố vai trò của nó trong bối cảnh Web3.
io.net Tham Gia Chương Trình Đối Tác Dell Technologies Để Tăng Cường Giải Pháp GPU Phi Tập Trung cover
8 ngày trước
io.net Tham Gia Chương Trình Đối Tác Dell Technologies Để Tăng Cường Giải Pháp GPU Phi Tập Trung
io.net, một người chơi nổi bật trong mạng lưới hạ tầng vật lý phi tập trung (DePIN) cho GPU, gần đây đã tham gia Chương Trình Đối Tác Dell Technologies. Liên minh chiến lược này được thiết kế để nâng cao phát triển kinh doanh, bán hàng và nỗ lực tiếp thị của io.net. Là một đối tác được ủy quyền và nhà cung cấp dịch vụ đám mây, io.net nhằm tích hợp mạng lưới GPU phi tập trung của mình với hạ tầng mạnh mẽ của Dell, cung cấp các giải pháp có thể mở rộng và tiết kiệm chi phí được thiết kế cho các công nghệ mới nổi như trí tuệ nhân tạo (AI), học máy (ML) và tính toán hiệu suất cao (HPC). Tausif Ahmed, Phó Chủ Tịch Phát Triển Kinh Doanh tại io.net, nhấn mạnh rằng sự hợp tác này đánh dấu một cột mốc quan trọng cho công ty, định vị nó như một nhà cung cấp giải pháp hàng đầu trong các lĩnh vực AI, ML và HPC. Chương Trình Đối Tác Dell Technologies là một sáng kiến quốc tế trang bị cho các đối tác những nguồn lực phát triển kinh doanh, bán hàng và tiếp thị cần thiết. Bằng cách tham gia chương trình này, io.net có được quyền truy cập vào một kho tài nguyên phong phú sẽ tạo điều kiện cho việc mở rộng mạng lưới GPU phi tập trung của mình và nâng cao khả năng thị trường. Sự hợp tác này không chỉ cho phép io.net chiến lược hóa với các đối tác khác mà còn mở rộng phạm vi toàn cầu của mình, cho phép triển khai các giải pháp tích hợp liền mạch sức mạnh GPU phi tập trung với hạ tầng phần cứng đáng tin cậy của Dell. Quan hệ đối tác này dự kiến sẽ củng cố nỗ lực đưa sản phẩm ra thị trường và các hoạt động tiếp thị chung của io.net, cuối cùng mang lại lợi ích cho các khách hàng doanh nghiệp đang tìm kiếm các giải pháp tính toán tiên tiến. Khi nhu cầu về dịch vụ tính toán có thể mở rộng và hiệu quả tiếp tục gia tăng trong các ngành AI và ML, mạng lưới phi tập trung của io.net cung cấp một lựa chọn hấp dẫn cho các nhà cung cấp dịch vụ đám mây truyền thống. Bằng cách cung cấp các cụm GPU theo yêu cầu có thể được triển khai nhanh chóng và với chi phí thấp hơn, io.net giải quyết các nút thắt mà các tổ chức gặp phải trong phát triển AI. Quan hệ đối tác với Dell được dự kiến sẽ dân chủ hóa quyền truy cập vào các giải pháp tính toán phi tập trung, đặc biệt cho các doanh nghiệp tham gia vào đào tạo AI, suy diễn và các trường hợp sử dụng HPC. Với sự hiện diện toàn cầu và danh tiếng đáng tin cậy của Dell, io.net được định vị tốt để tăng tốc việc áp dụng các giải pháp đổi mới này trên nhiều ngành công nghiệp khác nhau.
Auki Labs Ra Mắt Posemesh: Một Kỷ Nguyên Mới Cho Robot Hợp Tác cover
8 ngày trước
Auki Labs Ra Mắt Posemesh: Một Kỷ Nguyên Mới Cho Robot Hợp Tác
Trong lĩnh vực robot, thách thức về việc cho phép nhiều robot hợp tác hiệu quả trong các không gian chung đã là một trở ngại đáng kể. Auki Labs đang giải quyết vấn đề này thông qua việc phát triển posemesh, một bản đồ không gian chung giúp cải thiện cách mà robot nhận thức và tương tác với môi trường của chúng. Hiện tại, hầu hết các bản đồ không gian thiếu thông tin ngữ cảnh, chỉ cung cấp dữ liệu hình học mà không có nhãn đối tượng có ý nghĩa. Hạn chế này buộc các robot phải dựa vào các quy trình nhận diện đối tượng tốn kém về tính toán, điều này làm chậm quá trình ra quyết định và hạn chế khả năng mở rộng của các hệ thống tự động. Bằng cách giới thiệu posemesh, Auki Labs nhằm mục đích đơn giản hóa quy trình này, cho phép robot hoạt động hiệu quả hơn với yêu cầu tính toán giảm bớt. Robot Unitree G1 và Go2-W đang dẫn đầu trong sự đổi mới này, phục vụ như những nền tảng lý tưởng để triển khai posemesh. Với các cảm biến và khả năng di chuyển tiên tiến, những robot này có thể điều hướng các bản đồ không gian đã được xây dựng trước một cách hiệu quả. Posemesh tạo điều kiện cho sự hiểu biết chung giữa các robot, cho phép chúng phối hợp di chuyển và phân bổ nhiệm vụ mà không cần mỗi robot phải xử lý độc lập môi trường của nó. Cách tiếp cận hợp tác này không chỉ nâng cao hiệu quả mà còn giảm thiểu sự dư thừa, cuối cùng dẫn đến cải thiện giao tiếp giữa robot với robot và các hệ thống có thể mở rộng hơn trong nhiều ngành công nghiệp. Auki Labs hình dung một tương lai nơi các robot có thể thích ứng với môi trường theo thời gian thực, vượt qua các nút thắt về tính toán và làm việc cùng nhau một cách liền mạch. Bằng cách đầu tư vào posemesh và các nền tảng robot tiên tiến, công ty đang tiên phong một cách tiếp cận thông minh hơn đối với robot và AI. Sáng kiến này rất quan trọng cho việc áp dụng rộng rãi robot trong các môi trường hỗn hợp hoặc lai, vì nó mở khóa tiềm năng cho các đội robot hợp tác lớn hơn tổng thể của chúng. Khi Auki Labs tiếp tục đổi mới, hứa hẹn về một tương lai robot kết nối và hiệu quả hơn trở nên ngày càng rõ ràng.
Giao thức Lit: Hợp nhất Web với Giải pháp Mã hóa Tiên tiến cover
9 ngày trước
Giao thức Lit: Hợp nhất Web với Giải pháp Mã hóa Tiên tiến
Trong bối cảnh công nghệ blockchain đang phát triển nhanh chóng, Giao thức Lit đang có những bước tiến đáng kể trong việc nâng cao khả năng mã hóa để thu hẹp khoảng cách giữa các mạng và nền tảng phân mảnh. Là một mạng lưới quản lý khóa phi tập trung và tính toán riêng tư, Giao thức Lit cung cấp cho các nhà phát triển những công cụ cần thiết để quản lý bí mật một cách an toàn và xây dựng các ứng dụng tự động. Với sự hỗ trợ cơ bản cho các nguyên tắc mã hóa như chữ ký BLS và ECDSA, các nhà phát triển đã tận dụng Lit để tạo ra những ứng dụng đổi mới giúp tương tác liền mạch giữa môi trường web2 và web3. Năm nay đã chứng kiến sự tăng trưởng đáng kể trong các lĩnh vực như tác nhân AI, trừu tượng chuỗi, ví người dùng và dữ liệu web có thể xác minh, cho thấy tiềm năng của hạ tầng Lit. Nhìn về phía trước đến năm 2025, Giao thức Lit dự định mở rộng các dịch vụ mã hóa của mình bằng cách giới thiệu thêm các sơ đồ chữ ký và đường cong để nâng cao khả năng tương tác giữa các hệ sinh thái khác nhau. Các cải tiến chính bao gồm nâng cao hiệu suất cho việc ký ECDSA, hỗ trợ các đường cong NIST như P-256 và P-384, và tích hợp chữ ký Schnorr/EdDSA thông qua giao thức FROST. Những tiến bộ này sẽ cho phép các nhà phát triển xây dựng các ứng dụng an toàn và hiệu quả hơn trong khi đảm bảo tính tương thích với nhiều hệ sinh thái blockchain khác nhau. Hơn nữa, việc giới thiệu các khóa Mã hóa Hoàn toàn Đồng nhất (FHE) sẽ cho phép thực hiện các phép toán trên dữ liệu được mã hóa, bảo vệ quyền riêng tư trong khi cho phép phân tích nâng cao và chia sẻ dữ liệu an toàn. Những thành tựu của Giao thức Lit trong năm 2024 phản ánh sự cống hiến của cộng đồng phát triển của nó, với hơn 24 triệu yêu cầu mã hóa được thực hiện và hơn 1 triệu khóa được tạo ra. Các quan hệ đối tác đáng chú ý với các tổ chức như Fox, Genius và Emblem Vault làm nổi bật tính linh hoạt của Giao thức Lit trong nhiều ứng dụng, từ tài chính phi tập trung đến quản lý dữ liệu lập trình. Khi Lit tiếp tục đổi mới và mở rộng khả năng của mình, nó vẫn cam kết cung cấp cho các nhà phát triển những công cụ tốt nhất để tạo ra các ứng dụng an toàn, phi tập trung và tự động, cuối cùng hợp nhất bối cảnh kỹ thuật số phân mảnh mà chúng ta đang điều hướng ngày nay.
Solana Ra Mắt DePIN Compute Để Đáp Ứng Nhu Cầu Ngày Càng Tăng Của AI Về Năng Lực Tính Toán cover
10 ngày trước
Solana Ra Mắt DePIN Compute Để Đáp Ứng Nhu Cầu Ngày Càng Tăng Của AI Về Năng Lực Tính Toán
Solana đã ra mắt Decentralized Physical Infrastructure Networks (DePIN) Compute, một hệ thống phi tập trung đột phá được thiết kế để giải quyết nhu cầu ngày càng tăng về năng lực tính toán do sự mở rộng nhanh chóng của trí tuệ nhân tạo (AI). Các hệ thống tính toán truyền thống đang gặp khó khăn trong việc đáp ứng nhu cầu này, nhưng DePIN cung cấp một giải pháp mới bằng cách tận dụng các tài nguyên chưa được sử dụng, tương tự như cách mà Airbnb cho phép chủ nhà chia sẻ các tài sản trống của họ. Cách tiếp cận đổi mới này cho phép người dùng kiếm tiền từ các GPU nhàn rỗi của họ, làm cho chúng có sẵn cho các nhà phát triển, nhà nghiên cứu và các công ty khởi nghiệp cần tài nguyên tính toán. Chức năng của DePIN Compute rất đơn giản: người dùng có thể cho thuê sức mạnh GPU chưa sử dụng của họ, tạo ra một nguồn thu nhập mới trong khi tối ưu hóa việc sử dụng tài nguyên. Mô hình phi tập trung này đặc biệt có lợi cho các nhà phát triển và nhà nghiên cứu nhỏ, những người thường thấy các nền tảng tính toán hiệu suất cao là quá đắt đỏ. Bằng cách sử dụng công nghệ blockchain, DePIN Compute đảm bảo một phương pháp nhanh chóng, tiết kiệm chi phí và có thể mở rộng để chia sẻ tài nguyên tính toán, cuối cùng dân chủ hóa quyền truy cập vào công nghệ tiên tiến. Tầm quan trọng của DePIN Compute được nhấn mạnh bởi các khoản đầu tư gần đây, đặc biệt là cam kết hơn 10 triệu đô la của VanEck cho dự án, phản ánh sự tự tin mạnh mẽ vào tiềm năng của nó. Sự ủng hộ trước đó của VanEck đối với Solana đã góp phần vào phản ứng tích cực của thị trường, bao gồm việc nộp đơn cho Quỹ Giao dịch Hối đoái (ETF) đầu tiên dựa trên SOL tại Hoa Kỳ. Khi AI tiếp tục phát triển, các sáng kiến như DePIN Compute sẽ cách mạng hóa cách thức truy cập và sử dụng sức mạnh tính toán, thúc đẩy đổi mới và cho phép một loạt cá nhân và tổ chức rộng rãi hơn được hưởng lợi từ công nghệ tiên tiến.
Tăng cường quyền riêng tư dữ liệu trong kỷ nguyên Web3 cover
10 ngày trước
Tăng cường quyền riêng tư dữ liệu trong kỷ nguyên Web3
Trong bối cảnh internet đang phát triển, mối quan tâm về quyền riêng tư dữ liệu đang ở mức cao nhất từ trước đến nay. Một cuộc khảo sát gần đây của MAGNA/Ketch cho thấy chỉ 5% cá nhân cảm thấy hoàn toàn an toàn về cách các công ty thu thập và sử dụng thông tin cá nhân của họ. Khi chúng ta chuyển sang Web3, một mô hình mới đang xuất hiện, trao quyền cho người dùng lấy lại quyền kiểm soát dữ liệu của họ. Bằng cách tận dụng công nghệ blockchain cùng với các công nghệ tăng cường quyền riêng tư (PETs), Web3 không chỉ nâng cao bảo mật dữ liệu mà còn định nghĩa lại các tiêu chuẩn về quyền riêng tư và minh bạch trong quản lý dữ liệu. Phi tập trung là một nguyên tắc chính giúp nâng cao quyền riêng tư dữ liệu trong Web3. Các phương pháp truyền thống để bảo mật dữ liệu thường liên quan đến việc tập trung nó ở một vị trí, điều này có thể tạo ra một điểm thất bại duy nhất cho các tác nhân độc hại. Ngược lại, các hệ thống phi tập trung phân phối dữ liệu trên nhiều vị trí, làm cho việc khai thác của kẻ tấn công trở nên khó khăn hơn nhiều. Công nghệ blockchain đóng một vai trò quan trọng trong sự chuyển đổi này bằng cách cung cấp một bản ghi giao dịch minh bạch và không thể thay đổi trong khi đảm bảo rằng thông tin nhạy cảm vẫn được bảo vệ ngoài chuỗi. Cách tiếp cận kép này tạo ra một môi trường đáng tin cậy hơn cho người dùng, cho phép họ xác minh các thực tiễn quản lý dữ liệu mà không làm tổn hại đến quyền riêng tư của họ. Các công nghệ Web3 cũng mở đường cho các giải pháp sáng tạo cho phép người dùng kiếm tiền từ dữ liệu của họ trong khi vẫn giữ quyền kiểm soát việc sử dụng nó. Bằng cách sử dụng hợp đồng thông minh, cá nhân có thể thiết lập các quy tắc rõ ràng về ai có thể truy cập dữ liệu của họ và trong những hoàn cảnh nào. Sự chuyển đổi từ việc chỉ là người dùng sang trở thành chủ sở hữu dữ liệu đánh dấu một sự thay đổi đáng kể trong nền kinh tế số. Với các công cụ như Privacy Pass của iExec, người dùng có thể kiếm token trong khi giữ thông tin cá nhân của họ bí mật. Cuối cùng, Web3 không chỉ là về việc nâng cao quyền riêng tư dữ liệu; nó còn là về việc trao quyền cho cá nhân lấy lại quyền sở hữu dữ liệu của họ và hưởng lợi từ giá trị của nó một cách an toàn và minh bạch.
Đăng ký để nhận tin tức và cập nhật mới nhất từ DePIN