Drop by and find my writings easily!

Photo by Lesly Juarez on Unsplash

Once you reach here, I would like to say thanks to you. Thank all my readers for your reading and your claps as well!!!

“Sharing knowledge is sharing wealth” — quote by Andrew-Knox B Kaniki.

During my study, I have read so many papers, blogs, articles, etc., sometimes you may find that your problem cannot be found easily in an easy-to-find place, or you can find it in someone’s explanation but it is not written in your words, then it becomes more problematic to you. Once I wondered that why we keep searching and reading what is available on the…


Let’s upraise potentials that are not paid much attention

Generally, clustering is grouping multi-dimensional datasets into closely related groups. Classical representatives of clustering algorithms are K-means Clustering and Self-Organizing Map (SOM). You can easily find numerous resources for those algorithm explanations. This time, let me introduce to all of you another efficient clustering algorithm but seemingly no many researchers pay attention: Centroid Neural Network for Unsupervised Competitive Learning. Please click here to have a closer looking at the original paper.

Centroid Neural Network Result — Image by Author (source)

And now, let’s get started!

Centroid Neural Network (CentNN)

To avoid confusion with Convolution Neural Network, I would like to use the term “CentNN” in this post.

CentNN is an unsupervised competitive learning…


Giúp model tránh khỏi overfitting!

Tăng cường dữ liệu là một kỹ thuật để tăng tính đa dạng của tập dữ liệu mà không cần thu thập thêm dữ liệu thực nhưng vẫn giúp cải thiện độ chính xác cho model và giúp model tránh khỏi khả năng bị overfitting. Trong bài viết này, tôi sẽ giới thiệu đến các độc giả một số phương pháp tăng cường dữ liệu phổ biến và hiệu quả nhất cho bài toán phát hiện đối tượng (object detection) và cách lập trình những phương pháp này sử dụng ngôn ngữ Python và thư viện OpenCV.

Các phương pháp…


Khơi dậy những tiềm năng bị lãng quên

Photo by Joshua Aragon on Unsplash

Centroid Neural Network (CentNN) là thuật toán phân cụm hiệu quả và ổn định đã được áp dụng thành công cho nhiều bài toán. CentNN không yêu cầu hệ số học (learning coefficient) được xác định trước nhưng vẫn mang lại kết quả phân cụm cạnh tranh so với K-means Clustering và Self-Organization Map (SOM) khi mà những thuật toán này có kết quả phụ thuộc phần lớn vào các tham số ban đầu. Đối với những bạn đọc chưa biết hoặc chưa hiểu về thuật toán tuyệt vời này, bạn có thể đọc bài viết diễn giải của tôi…


Prevent Your Model from Overfitting

Photo by Paweł Czerwiński on Unsplash

Data augmentation is a technique to increase the diversity of dataset without an effort to collect any more real data but still help improve your model accuracy and prevent the model from overfitting. In this post, you will learn to implement the most popular and efficient data augmentation procedures for object detection task using Python and OpenCV.

The set of data augmentation methods that are about to be introduced includes:

  1. Random Crop
  2. Cutout
  3. ColorJitter
  4. Adding Noise
  5. Filtering

Firstly, let’s import several libraries and prepare some necessary subroutines before going ahead.

The below image is used as a sample image…


Let’s elevate potentials that are not paid much attention

Photo by Alex on Unsplash

Centroid neural network (CentNN) is an efficient and stable clustering algorithm that has been successfully applied to numerous problems. CentNN does not require a pre-determined learning coefficient but still yields competitive clustering results compared to K-means Clustering or Self-Organizing Map (SOM) whose results heavily depend on the initial parameters. For those who neither know about nor understand this great algorithm, you are welcome to read my explanation with visual examples here. And now, let’s make CentNN clear with several lines of codes.

I would like to choose 2-d data clustering problem as the explaining example in this post because it…


Tóm gọn các khái niệm cơ bản!

Một bậc thầy về xác suất

Xác suất là mô tả về mặt toán học khả năng xảy ra một biến cố. Xác suất của một biến cố nằm trong khoảng từ 0 đến 1, trong đó 0 thể hiện sự bất khả thi của biến cố và 1 cho biết sự chắc chắn của biến cố đó. Mọi thứ xảy ra trong vũ trụ này đều có thể được minh họa như một ví dụ về xác suất của một biến cố. …


Find things of probability in one place!

[image-source]

Probability is numerical descriptions of how likely an event is to occur. The probability of an event is ranged between 0 and 1, where 0 indicates the impossibility of the event and 1 indicates the certainty. Everything that happens to this universe can be illustrated as an example of the probability of an event. …


Mục tiêu của bài toán phân cụm là nhóm các dữ liệu cho trước thành các cụm dữ liệu có đặc điểm tương đồng với nhau. Hai đại diện kinh điển trong bài toán phân cụm có thể kể đến là K-Means Clustering và Self-Organizing Map (SOM). Các bạn có thể dễ dàng tìm kiếm trên internet các tài liệu về hai thuật toán trên. …

Lean Tran

Ph.D. Candidate in Machine Learning and Computer Vision. “Once the WHY is clear, the HOW is easy.”

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store