STEGANOGRAPHY LÀ GÌ

     
1. Steganography là gì ?

Nếu là một tín đồ trinh thám tuyệt các văn hóa truyền thống phẩm về điệp viên, chắc rằng bạn không hề lạ gì với vấn đề truyền tin bằng những đoạn tin lăng xê tưởng như rất thông thường trên báo, với mật mã "hình nhân dancing múa" trong Sherlock Holmes, hay gần gụi nhất là hồi nhỏ chúng ta phân tích mực vô hình: dùng nước chanh viết lên giấy, hóng khô rồi hơ nóng, thông điệp viết bởi nước chanh sẽ dần hiện ra.

Bạn đang xem: Steganography là gì

Bạn đã xem: Steganography là gì

Những lấy ví dụ như trên hầu hết là một hiệ tượng của Steganography. Nói dễ dàng và đơn giản là chúng ta sẽ tạo thành một các loại thông điệp hoặc mật mã mà người ngoài nhìn vào, không các không giải được ngoại giả không phân biệt được rằng nó có chứa đựng một thông điệp kín đáo - "The art of disguise is knowing how to lớn hide in plain sight"

Theo tư tưởng từ Wikipedia:

Steganography (Kỹ thuật che tin tuyệt kỹ thuật che thư, chuyên môn ẩn mã) là nghệ thuật và thẩm mỹ và khoa học về vấn đề viết và đưa tải các thông điệp một phương pháp bí mật, làm sao cho ngoại trừ fan gửi và người nhận, không ai biết tới việc tồn trên của thông điệp, là 1 trong dạng của bảo mật bằng phương pháp che giấu. Tự steganography tất cả gốc Hy lạp tức là "giấu tin" phối kết hợp từ nhị từ steganos (στεγανός) nghĩa là "ẩn nấp để bảo vệ" với graphein (γράφειν) nghĩa là "viết".

Trong không khí số, steganography tồn tại bên dưới dạng file, lời nhắn, hình ảnh hoặc đoạn video clip được ẩn đậy trong một file/ lời nhắn/ hình hình ảnh hoặc đoạn phim khác. Những file truyền thông là lớp vỏ quấn (cover) lý tưởng để đậy tin vị chúng có size lớn. Ví dụ tín đồ gửi tất cả thể đổi khác thành phần màu sắc của một vài pixel bên trên tấm ảnh tương ứng với các ký tự vào bảng chữ cái, sự biến hóa này rất nhỏ dại đến mức không thể nhận biết bằng mắt thường. Trong nhì hình phía dưới, hình phía bên trái là stego image - hình hình ảnh đã được mua "thông điệp" túng bấn mật bằng phương pháp xử lý màu sắc component của từng pixel. Hình bên cần là "thông điệp" sau khoản thời gian được extract ra.

Xem thêm: Giải Đáp Thắc Mắc: Kích Thước Màn Hình Iphone 8 Bao Nhiêu Inch ? Cầm Có Vừa Tay


*

*

2. Text Steganography

Như sẽ nói làm việc trên, có nhiều phương tiện rất có thể dùng để làm vật trung gian sở hữu tin: file, audio, hình ảnh, video, vv. Dẫu vậy trong cuộc sống thường ngày hàng ngày thì văn bạn dạng (text) chính là phương một thể truyền tin phổ biến nhất. Mặc dù so với những file media thì text có mức độ mã hóa thông tin cao hơn nữa dẫn cho ít tin tức dư thừa (redundant information) hơn, tạo nên việc cất thông tin trong đó khó hơn rất nhiều. Vào phạm vi bài viết này, mình đang tìm hiểu về bài toán steganography với định hình text cũng giống như một số kỹ thuật đậy tin (generation-based) trong văn bạn dạng được cách tân và phát triển trong thời hạn gần đây.

Xem thêm: Messenger Không Gửi Được Tin Nhắn Messenger Không Gửi Được Tin Nhắn

2.1. Đặt vấn đề

Giả sử A mong muốn gửi đến B một tin nhắn chứa tin tức nhạy cảm qua 1 kênh được giám sát và đo lường bởi C. Kênh này có thể được sử dụng chung nhằm liên lạc vị nhiều mặt khác nhau. Tin tức được truyền đi vào kênh là văn phiên bản chứa ngôn ngữ tự nhiên và thoải mái (natural language). A vừa phải bảo đảm an toàn chỉ gồm mình B phát âm được nội dung tin nhắn, vừa phải tránh gửi phần lớn nội dung "mất từ bỏ nhiên" rất có thể khiến C nghi ngờ.Vậy A và B có thể thực hiện công việc như sau:


*

Mô hình tổng quát của bài toán giấu tin được thể hiện như sau:

*

Trong đó:

mmm là tin nhắn bí mật (thường được mã hóa thành một một chuỗi các bit theo đúng phân phối đều (uniform distribution)yyy là đoạn cover text - stegotextq(y)q(y)q(y) là phân phối xác suất của yfff là một hàm khả nghịch dùng để biến đổi m thành yCả A và B đều sử dụng cùng một mô hình ngôn ngữ pLMp_LMpLM​ vào quá trình encode, giấu tin và decode

Như vậy ta hoàn toàn có thể thấy quá trình này tương quan đến hai công đoạn chính: (1) mã hóa đoạn tin đề xuất chuyển đi và (2) đậy nó vào trong một đoạn văn phiên bản bình thường.

Vậy để hệ thống steganography hoạt động hiệu quả thì hai quy trình này cần được đạt số đông mục tiêu nào?Hay nói cách khác, bao gồm metrics như thế nào để reviews tính hiệu quả của của một phương pháp giấu tin?

2.2. Evaluation metrics

2.2.1. Perplexity

Perplexity là thước đo tiến công giá quality của một mô hình ngôn ngữ (language model).Giả sử khi bọn họ xây dựng một mô hình ngôn ngữ xuất phát điểm từ 1 tập chủng loại câu, ta sẽ lưu lại lại một tập câu để kiểm tra (held-out):