Google AI tái tạo ảnh siêu phân giải quá đỉnh

Thứ tư - 01/09/2021 23:13 511 0
AI siêu phân giải của Google tăng thêm công lực cho việc xử lý hình ảnh. Máy học (ML) sẽ tổng hợp hình ảnh tự nhiên từ kho dữ liệu ảnh, và ứng dụng cho nhiều tính năng xử lý ảnh, siêu độ phân giải là một ứng dụng. Tính năng siêu độ phân giải có nhiều hữu ích, cụ thể nhất là có thể khôi phục các ảnh chân dung có kích thước rất nhỏ, ít chi tiết thành bức ảnh có độ phân giải chi tiết cao.
 
5617888 Sequence 01 4
5617888 Sequence 01 4

cascade_fig.jpg

Goolge gọi là “mô hình khuếch tán” SR3, hoạt động cơ bản bằng cách thêm dần hạt nhiễu vào, phủ lấp các chi tiết dữ liệu và cả khoảng trống chi tiết cho đến khi chỉ còn nhiễu hạt mà thôi, rồi thuật toán chạy đảo ngược quá trình để tổng hợp dữ liệu nhiễu thuần tuý bằng cách giảm dần dữ liệu đến khi còn lại mẫu sạch dựa trên mẫu ảnh đầu vào đã được bù chi tiết ở những điểm bị trống từ ảnh gốc. Họ gọi là thuật toán tối ưu hoá theo mật độ dữ liệu để tạo ra các mẫu tốt hơn.

 
Sequence 01_2.gif

Sequence 01_3.gif

Sequence 01_4.gif

Sequence 01_6.gif

SR3 lấy đầu vào là hình ảnh có độ phân giải thấp rồi chạy để tái tạo thành hình ảnh có độ phân giải cao, ở bước đầu được gọi là làm hỏng hình ảnh bằng cách phủ nhiễu hạt, thêm vào cho đến khi chỉ là hạt nhiễu. Rồi máy học sẽ học cách đảo ngược quy trình này, loại bỏ dần nhiễu, giữ lại nhiễu thuần tuý dựa trên mẫu ảnh đầu vào để có kết quả bức ảnh nhiều chi tiết hơn. SR3 cũng chạy các mô hình xếp nhiều lớp để tăng tỷ lệ siêu phân giải hiệu quả hơn. Chẳng hạn xếp chồng mô hình khuôn mặt 64x64 -→ 256x256 và 256x256 -→ 1024x1024 đó chính là động tác thực hiện phục hồi siêu phân giải từ 64x64 -→ 1024x1024.
image3.gif
 
super_res_examples.png
 
image4-2.png

Độ chính xác của SR3 là rất khả quan, nhưng Google còn bước xử lý với mô hình cao hơn, gọi là CDM - khuếch tán có điều kiện theo lớp được học dựa trên kho dữ liệu ImageNet tạo ra ảnh siêu phân giải và tự nhiên hơn. ImageNet là tập dữ liệu khó, được xây dựng thành một chuỗi nhiều mô hình khuếch tán cùng lúc, hoạt động phân tầng, xâu chuỗi nhiều mô hình với nhau, tạo nên độ phân giải cao nhất.
 
image2.png
 
image1.png

Nhiều người hy vọng rằng, mô hình này sẽ sớm trở thành tính năng mặc định không chỉ ở giai đoạn phục hồi (hậu kỳ) ảnh, mà ngay tức thì khi chụp ảnh. Chẳng hạn chụp một bức ảnh zoom bằng kỹ thuật số trên điện thoại, ở 10x, 20x,… 50x chẳng hạn, độ phân giải chỉ còn rất ít, đó là giới hạn làm đau đầu nhiều nhà sản xuất. Điện thoại rất khó đến gắn ống kính tele quang học chất lượng. Nếu phần mềm giải quyết được điều này, cũng là thêm một ưu thế cho người dùng.

Nguồn tin: Sưu tầm: Internet

 Tags: Google AI

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Agribank Free chuyển tiền
Agribank 30 Năm
Email nội bộ
Huế kinh đô xua, trải nghiệm mới
Festival Huế 2010
Thăm dò ý kiến

Website có thân thiện với bạn ?

Thống kê truy cập
  • Đang truy cập4
  • Hôm nay555
  • Tháng hiện tại6,346
  • Tổng lượt truy cập2,604,373
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây