FULLY CONNECTED LAYER LÀ GÌ

 - 

Bài này sẽ trình làng về convolutional neural network, sẽ tiến hành dùng khi đầu vào của neural network là ảnh. Mọi tín đồ nên phát âm trước bài xích neural network cùng xử lý ảnh trước khi ban đầu bài này.

Bạn đang xem: Fully connected layer là gì


Thiết lập bài xích toán

Gần đây vấn đề kiểm tra mã captcha nhằm xác minh không hẳn robot của google bị chính robot quá qua


*
quy mô neural network.

Mỗi hidden layer được hotline là fully connected layer, tên gọi theo đúng ý nghĩa, từng node vào hidden layer được liên kết với toàn bộ các node trong layer trước. Cả mô hình được điện thoại tư vấn là fully connected neural network (FCN).

Vấn đề của fully connected neural network với xử lý ảnh

Như bài bác trước về giải pháp xử lý ảnh, thì ảnh màu 64*64 được màn trình diễn dưới dạng 1 tensor 64*64*3. đề xuất để thể hiện hết ngôn từ của bức ảnh thì yêu cầu truyền vào input layer tất cả các px (64*64*3 = 12288). Nghĩa là input layer giờ bao gồm 12288 nodes.


*

Tuy nhiên hình ảnh màu gồm tới 3 channels red, green, blue nên những lúc biểu diễn hình ảnh dưới dạng tensor 3 chiều. đề xuất ta cũng trở thành định nghĩa kernel là một trong những tensor 3 chiều kích cỡ k*k*3.

Xem thêm: Công Thức Tính Roi Là Gì? 2 Công Thức Tính Roi Chuẩn Nhất Chỉ Số Roi Là Gì


*
Sau pooling layer (2*2).Source: http://cs231n.github.io/convolutional-networks/

Có 2 nhiều loại pooling layer thịnh hành là: max pooling cùng average pooling.


*
Ví dụ mô hình convolutional neural network. Source: https://www.easy-tensorflow.com/tf-tutorials/convolutional-neural-nets-cnns

Có thể xem cụ thể trong từng layer sống đây.


Mạng VGG 16

VGG16 là mạng convolutional neural network được lời khuyên bởi K. Simonyan and A. Zisserman, University of Oxford. Mã sản phẩm sau khi train vày mạng VGG16 đạt độ đúng mực 92.7% top-5 thử nghiệm trong tài liệu ImageNet gồm 14 triệu hình ảnh thuộc 1000 lớp khác nhau. Tiếng áp dụng kiến thức và kỹ năng ở trên để phân tích mạng VGG 16.


Phân tích:

Convolutional layer: size 3*3, padding=1, stride=1. Vì sao không ghi stride, padding mà vẫn biết? vì chưng mặc định đã là stride=1 với padding làm cho output thuộc width cùng height cùng với input.Pool/2 : max pooling layer với form size 2*23*3 conv, 64: thì 64 là số kernel áp dụng trong layer đấy, giỏi depth của output của layer đấy.Càng các convolutional layer sau thì size width, height càng giảm nhưng depth càng tăng.Sau khá nhiều convolutional layer và pooling layer thì tài liệu được flatten và bỏ vào fully connected layer.

Xem thêm: Nam Diễn Viên Hài Hoàng Phúc Qua Đời, Diễn Viên Hài Hoàng Phúc Qua Đời

Bài sau mình sẽ giới thiệu về keras và hướng dẫn dùng keras để áp dụng convolutional neural vào những ứng dụng như thừa nhận diện số viết, dự đoán góc di chuyển trong ô tô tự lái.



Search for:

Bài viết sát đây


Mục bài bác viết


Deep Learning cơ phiên bản ©2022. All Rights Reserved. Powered by WordPress.Theme by Phoenix website Solutions