Database Design: Thiết kế cơ sở dữ liệu hiệu quả

Mục lục

Database Design: Thiết kế cơ sở dữ liệu hiệu quả

Tôi từng thấy một startup ở TP.HCM cười khả lạc vì "chỉ cần scale" cơ sở dữ liệu. Tháng thứ nhất, họ có 10K users. Tháng thứ sáu, query SELECT * from orders cần 45 giây để chạy. Không phải cơ sở dữ liệu yếu, mà là thiết kế từ đầu đã bị sai. Họ mất 3 tháng refactor toàn bộ schema mà vẫn không xong hẳn.

Đó là lý do tôi đặt tiêu đề này không phải "Database Design Best Practices" buồn ngủ, mà là câu chuyện thực.

Thiết kế schema là thiết kế business logic

Mọi người thường nghĩ database chỉ là chỗ lưu trữ. Sai lận. Schema chính là biểu diễn của cách bạn hiểu business. Nếu schema sai, mọi thứ sau đó sẽ tệ.

Ví dụ: bạn làm app giao hàng tại Việt Nam. Bạn sẽ có bảng orders. Nhưng sẽ có order chưa thanh toán, order đã thanh toán, order đã giao, order bị hủy. Bạn có 2 cách:

Cách 1: Thêm column status và paid, delivered, cancelled (boolean). Cách 2: Có một bảng order_status_history lưu lại toàn bộ hành trình, với timestamp.

Cách 1 nhanh hơn khi query (ít joins), nhưng khi sếp muốn xem "có bao nhiêu order đó ở status nào vào ngày nào", bạn méo có dữ liệu. Cách 2 chậm hơn một tí khi query (vì cần LEFT JOIN), nhưng bạn có toàn bộ lịch sử — điều vô giá khi làm analytics, tracing bugs, hay phát hiện gian lận.

Startup mà tôi nói ở trên chọn cách 1. 6 tháng sau, họ muốn làm feature "hiển thị timeline order", phải sửa 10 cái schema khác. Nếu thiết kế từ đầu theo cách 2, sẽ còn 8 schema.

Normalize vs Denormalize — không phải đen trắng

Chia sẻ bài viết

Database Design: Thiết kế cơ sở dữ liệu hiệu quả