Khám phá sức mạnh đáng kinh ngạc của Mô hình AI Flux mới: Vượt qua Stable Diffusion và nhiều hơn thế!

Khám phá sức mạnh đáng kinh ngạc của mô hình AI Flux mới, vượt trội hơn Stable Diffusion trong việc tạo ra hình ảnh. Tìm hiểu cách cài đặt và tối ưu hóa AI tiên tiến này để có được hình ảnh ấn tượng, ngay cả trên GPU cấu hình thấp. Mở khóa tương lai của sự sáng tạo được hỗ trợ bởi AI.

24 tháng 2, 2025

party-gif

Khám phá mô hình AI đột phá đang định nghĩa lại việc tạo ra hình ảnh. Flux, một mô hình với 12 tỷ tham số, vượt trội hơn cả Stable Diffusion mới nhất về mức độ chân thực của ảnh, độ chính xác của chuyển đổi văn bản sang hình ảnh và chất lượng tổng thể. Khám phá quá trình cài đặt dễ dàng và giải phóng sức mạnh của công nghệ tiên tiến này để tạo ra những hình ảnh ấn tượng chỉ với vài cú nhấp chuột.

Flux: Vua AI Mới Đánh Bại Stable Diffusion

Black Forest Labs, một nhóm nhỏ gồm 15 người, trong đó 14 người đến từ Stability AI, vừa mới phát hành một mô hình AI tiên tiến gọi là Flux. Mô hình này có 12 tỷ tham số và vượt trội hơn bất kỳ mô hình tạo hình ảnh trước đó, bao gồm cả Stable Diffusion 3, về chất lượng hình ảnh, căn chỉnh văn bản-sang-hình ảnh và khả năng tổng thể.

Flux có thể tạo ra những bức ảnh đẹp, chân thực như ảnh chụp với những bàn tay chính xác, nghệ thuật phong cách anime và nhiều hơn nữa, đồng thời tuân thủ chặt chẽ các lời nhắc đã cho. Mô hình này có hai phiên bản: Flux Dev tiêu chuẩn và Flux Chanel nhanh hơn, có thể tạo ra hình ảnh chỉ trong 4 bước nhưng chất lượng hơi thấp hơn.

Để cài đặt và sử dụng Flux, bạn có thể sử dụng trình cài đặt được cung cấp hoặc tải xuống và thiết lập thủ công các tệp cần thiết. Quá trình cài đặt rất đơn giản, và các mô hình có thể được chạy cục bộ trên máy tính của bạn hoặc trên GPU được thuê, chẳng hạn như thông qua dịch vụ RunPod.

Khi chạy Flux, điều quan trọng là phải tối ưu hóa các cài đặt dựa trên VRAM của GPU của bạn. Ví dụ, nếu bạn có 3090 hoặc 4090, bạn có thể tắt bộ nhớ cache CUDA để tối đa hóa hiệu suất. Đối với GPU VRAM thấp hơn, bạn nên sử dụng các phiên bản FP8 của các mô hình và mô hình clip FP16 để giảm mức sử dụng VRAM.

Cài đặt Flux Cục bộ

Để cài đặt mô hình Flux cục bộ, bạn có hai tùy chọn:

  1. Sử dụng Trình cài đặt Maring:

    • Nếu bạn là người ủng hộ Patreon, bạn có thể sử dụng Trình cài đặt tự động Flux Confy UI Manager được cung cấp.
    • Chạy trình cài đặt, chọn tùy chọn "cài đặt nhanh, VRAM thấp" và để nó tải xuống và thiết lập các tệp cần thiết.
    • Nếu bạn đã có Confy UI được cài đặt, bạn có thể sử dụng tệp "flux s model install.bat" để cài đặt các mô hình Flux.
  2. Cài đặt thủ công:

    • Tải xuống và giải nén bản xây dựng di động độc lập của Confy UI cho Windows.
    • Tải xuống các tệp sau:
      • Mô hình VAE (AE.sft)
      • Mô hình Flux Dev (Flux Dev.sft) hoặc mô hình Flux FP8 được tối ưu hóa
      • Mô hình Flux Chanel (Flux Chanel.sft) hoặc mô hình Flux Chanel FP8 được tối ưu hóa
      • Bộ mã hóa văn bản (T5X XL và CLIP ViT-L/14)
    • Đặt các tệp đã tải xuống vào các thư mục phù hợp trong thư mục Confy UI:
      • Mô hình VAE trong thư mục "vae"
      • Các mô hình Flux trong thư mục "models/unit"
      • Bộ mã hóa văn bản trong thư mục "models/clip"
    • Khởi chạy Confy UI và tải quy trình làm việc.

Chạy Flux trên RunPod

Để chạy mô hình Flux trên RunPod, hãy làm theo các bước sau:

  1. Tạo một tài khoản mới trên RunPod bằng cách nhấp vào liên kết trong mô tả.
  2. Triển khai một pod GPU và chọn một thẻ 24GB VRAM như RTX 3090 hoặc RTX A5000.
  3. Thay đổi mẫu thành mẫu của ashle kza và chỉnh sửa ổ đĩa chứa thành 50GB.
  4. Nhấp vào "Triển khai theo yêu cầu" để khởi chạy pod.
  5. Khi pod đang chạy, nhấp vào "Kết nối" và sau đó nhấp vào Cổng 8888.
  6. Nếu bạn là người ủng hộ Patreon, kéo và thả một trong ba tệp (A, B hoặc C) vào không gian làm việc để cài đặt mô hình Flux được tối ưu hóa.
  7. Sao chép và dán hai dòng lệnh từ bài đăng Patreon vào terminal để tải xuống các mô hình tự động.
  8. Khi cài đặt hoàn tất, quay lại và nhấp vào Cổng 3000 để khởi chạy Conf UI.
  9. Tải quy trình làm việc đầu tiên, sau đó cập nhật Conf UI lên phiên bản mới nhất.
  10. Đóng cửa sổ và khởi chạy lại Cổng 3000.
  11. Đảm bảo bạn đang sử dụng mô hình FP8 Safe TS, sau đó nhập lời nhắc của bạn và nhấp vào "Q Prompt" để tạo ra hình ảnh.

Khả năng và Giới hạn của Mô hình Flux

Mô hình Flux, được phát triển bởi công ty mới Black Forest Labs, là một hệ thống AI đáng chú ý đã vượt qua các mô hình tiên tiến nhất trước đây trong các nhiệm vụ tạo hình ảnh. Với 12 tỷ tham số, mô hình Flux có thể tạo ra những bức ảnh đẹp, chân thực như ảnh chụp mà sát với các lời nhắc đã cho, bao gồm cả bàn tay chính xác, nghệ thuật phong cách anime và khả năng căn chỉnh văn bản-sang-hình ảnh ấn tượng.

Tuy nhiên, mô hình Flux không phải không có hạn chế. Mặc dù nó bị kiểm duyệt ít hơn các mô hình như Stable Diffusion 3, nhưng nó vẫn có những hạn chế về loại nội dung mà nó có thể tạo ra. Mô hình này không thể tạo ra những hình ảnh cực đoan, không an toàn cho công việc, vì điều đó vượt quá khả năng dự định của nó.

Một vấn đề tiềm ẩn khác với mô hình Flux là thách thức trong việc tinh chỉnh hoặc đào tạo nó thêm. Kích thước khổng lồ của mô hình, với 12 tỷ tham số, có nghĩa là việc đào tạo nó sẽ yêu cầu một lượng lớn năng lực tính toán, có thể vượt quá khả năng của các GPU cấp người dùng. Điều này có thể hạn chế khả năng của cộng đồng cải thiện hoặc tùy chỉnh mô hình, vì các tài nguyên cần thiết cho việc đào tạo có thể không sẵn có.

Kết luận

Mô hình flux từ Black Forest Labs là một hệ thống AI cực kỳ mạnh mẽ có thể tạo ra những bức ảnh ấn tượng với độ chính xác và chi tiết đáng kinh ngạc. Với 12 tỷ tham số của nó, nó vượt trội hơn cả các mô hình mới nhất như Stable Diffusion 3, tạo ra những kết quả thực sự ấn tượng.

Mặc dù khả năng của mô hình là không thể chối cãi, nhưng vẫn có một số vấn đề tiềm ẩn cần xem xét. Năng lực tính toán khổng lồ cần thiết để đào tạo một mô hình lớn như vậy có thể khiến việc tinh chỉnh hoặc cải thiện nó trở nên khó khăn đối với người dùng cá nhân. Ngoài ra, mức độ kiểm duyệt của mô hình vẫn chưa rõ ràng và nó có thể không thể tạo ra một số loại nội dung nhất định.

Mặc dù có những lo ngại này, mô hình flux vẫn đại diện cho một bước tiến đáng kể trong lĩnh vực tạo hình ảnh bằng AI. Khả năng của nó trong việc tuân thủ các lời nhắc một cách chính xác và tạo ra những bức ảnh siêu thực, phong cách anime và thậm chí chân thực như ảnh chụp thực sự đáng kinh ngạc. Đối với những người dùng có phần cứng cần thiết, mô hình này có thể được cài đặt và sử dụng dễ dàng, cả cục bộ và thông qua các dịch vụ dựa trên đám mây như RunPod.

Nói chung, mô hình flux là một bước đột phá trong thế giới tạo tác nghệ thuật bằng AI, và tác động của nó đối với lĩnh vực này có thể sẽ rất sâu rộng. Khi cộng đồng tiếp tục khám phá và thử nghiệm với công nghệ này, chúng ta có thể mong đợi sẽ thấy nhiều ứng dụng ấn tượng và sáng tạo hơn nữa trong tương lai.

Câu hỏi thường gặp