R101 - Bài 1: R là cái quái gì mà dân tình mê mẩn? (Kèm Hướng Dẫn Cài Đặt 5 Phút)
Bạn đã bao giờ phát điên vì file Excel 500MB treo máy? Hay nhìn bảng kết quả SPSS xấu đau xấu đớn? Chào mừng đến với R - tình yêu đích thực của dân Data Analyst.

Chào các bạn, Hải đây.
Nếu các bạn đang làm Marketing, HR hay Kinh doanh, chắc hẳn các bạn đã quá quen với Excel. Excel tuyệt vời, không ai phủ nhận. Nhưng...
Có bao giờ bạn mở một file Excel nặng tầm 500MB lên và máy tính của bạn bắt đầu kêu như máy cày, rồi màn hình "Not Responding" quay đều quay đều chưa? Tôi thì bị rồi, và tôi suýt đập máy.
Hoặc có bao giờ bạn chạy mô hình trên SPSS, copy cái bảng kết quả ra Word/PowerPoint và thấy nó... xấu đau xấu đớn, format lệch lạc, nhìn chán chả buồn đọc không?
Đó là lúc bạn cần đến R.
1. Tại sao lại là R mà không phải Python hay cái khác?
Thực ra Python cũng rất xịn, nhất là cho dân Engineering/AI. Nhưng với dân Kinh tế/Xã hội như chúng ta, R là "chân ái" vì:
- Nó sinh ra để làm thống kê: Python là ngôn ngữ đa năng (làm web, game...), còn R sinh ra từ đầu chỉ để phục vụ tính toán. Các hàm thống kê của nó cực kỳ chuyên sâu và chuẩn xác.
- Khả năng vẽ hình "Vô đối": Với gói `ggplot2`, R đè bẹp tất cả các đối thủ về khoản visual. Bạn có thể vẽ những biểu đồ đẹp như tạp chí The Economist chỉ với vài dòng code.
- Miễn phí 100%: SPSS giá cả ngàn đô (hoặc bạn phải dùng crack lén lút). R thì free, cài ở đâu cũng được, không sợ bản quyền.
- Reproducible Research (Nghiên cứu có thể lặp lại): Đây là cái hay nhất. Bạn viết code 1 lần, tháng sau có data mới, bấm nút "Run" cái là xong. Không phải ngồi click chuột thủ công làm lại từ đầu như Excel.
2. Cài đặt R & RStudio trong 5 phút (Dễ hơn cài game)
Để chạy được R, chúng ta cần 2 thứ:
1. R (Engine): Cái lõi để tính toán. (Giống như cái động cơ xe).
2. RStudio (IDE): Cái giao diện đẹp đẽ để mình viết code. (Giống như cái vỏ xe, vô lăng, ghế ngồi).
Link tải đây (chọn bản Free nhé): [Posit.co](https://posit.co/download/rstudio-desktop/)
Sau khi cài xong, mở RStudio lên, bạn sẽ thấy nó chia làm 4 góc như "Bánh chưng" thế này:

Giao diện RStudio: Góc trên trái là Bếp (Source), dưới trái là Chỗ thử món (Console), trên phải là Tủ lạnh (Environment), dưới phải là Tủ chén (Files/Plots).
Giải ngố:
- Source (Góc 1): Nơi viết công thức nấu ăn (lưu lại được).
- Console (Góc 2): Nơi nấu thử. Gõ `1 + 1` Enter cái nó ra `2` luôn. Tắt máy là mất.
- Environment (Góc 3): Kho nguyên liệu. Bạn nhập file excel vào, biến số nó sẽ nằm ở đây.
- Files/Plots (Góc 4): Nơi hiển thị biểu đồ vẽ ra. Đẹp hay xấu là nhìn vào đây.
3. Chạy dòng code đầu tiên: Hello World
Mở RStudio lên, gõ dòng này vào Console rồi Enter:
`print("Xin chào, tôi là Researcher cool ngầu!")`
Nó hiện ra:
`[1] "Xin chào, tôi là Researcher cool ngầu!"`
Chúc mừng! Bạn đã chính thức trở thành "Coder". Dễ quá mức quy định đúng không? Hẹn gặp lại ở bài sau chúng ta sẽ "bẻ khóa" Dữ liệu.

