Thứ Sáu, 21 tháng 2, 2014

Tài liệu PHÂN TÍCH THỐNG KÊ SỬ DỤNG EXCEL® ppt

Copyright© 2008 Development and Policies Research Center (DEPOCEN)

5

Một số lưu ý: Dòng trên cùng cho người sử dụng biết tên các biến số. Mỗi dòng trong
bảng số liệu gọi là một quan sát. Đơn vị quan sát có thể ở cấp cá nhân (số liệu về các cá
nhân), hộ gia đình (số liệu về gia đình), công ty, quận, tỉnh, quốc gia. Số liệu không nhất
thiết phải ở dạng con số (numerics), mà có thể ở dạng chữ (string). Trong Hình 1, cột thứ
2, thể hiện biến số Tên cho ta thấy số liệu là tên người ở dạng chữ.

2 NHẬPDỮLIỆU

Để có số liệu như trong Hình 1, thông thương người sử dụng/nhà nghiên cứu phải tiến
hành nhập số liệu vào trong EXCEL. Việc nhập dữ liệu trong Excel rất đơn giản. Một
bảng EXCEL (worksheet) được chia thành các dòng và các cột. Dòng được đánh dấu
bằng số và cột được đánh số bằng chữ. Dòng và cột tạo ra các ô trong worksheet. Mỗi ô
đều có địa chỉ theo số của dòng và chữ của cột. Để có thể
nhập dữ liệu vào một ô, chúng
ta cần phải ô cần nhập dữ liệu là ô đang hoạt động. Để làm điều này, chúng ta nhấn chuột
vào ô đó.

Mỗi ô có thể chứa các dãy ký tự, các giá trị bằng số, giá trị logic hoặc chứa công thức.
Dãy ký tự có thể bao gồm chữ, số hoặc ký hiệu. Giá trị bằng số là những con số tự nhiên
mà chúng ta biết và chỉ có con số mới có thể được dùng trong tính toán. Giá trị logic là
giá trị cho ta biết một điều gì đó “đúng” hoặc “sai”. Công thức cho phép chúng ta thực
hiện việc tính toán một cách tự động đối với giá trị của các ô khác.

3 BỘCÔNGCỤDATAANALYSISTOOLPACT

Microsoft Excel có một bộ công cụ có thể dùng để phân tích dữ liệu được gọi là
Analysis Toolpack mà chúng ta có thể sử dụng để phân tích dữ liệu. Nếu như lệnh Data
Analysis đã hiển thị trên thanh công cụ Tool menu, thì bộ công cụ Analysis Toolpack
đã được cài trên hệ thống. Nếu không chúng ta có thể tiến hành cài bộ công cụ này như
sau. Trước hết bạn chọn thanh công cụ Tool, sau đó chọn Add-ins, sau đó nhấn nút OK.
Copyright© 2008 Development and Policies Research Center (DEPOCEN)

6
Nếu như, mục Analysis Toolpack không được liệt kê trong cửa sổ Add-ins thì bạn bấm
nút Browse để tìm tệp Analys32.xll thường ở tại program files\microsoft office\office\
library\analysis. Sau khi đã tìm và chọn được tệp analyse32.xll, bạn nhấn nút OK. Sau
khi làm các thao tác này, bộ công cụ Analysis Toolpack sẽ được cài đặt và bạn có thể sử
dụng.

Microsoft Excel là một phần mềm bảng tính rất mạnh được sử dụng để duy trì thông tin
và dữ liệ
u theo cột và hàng. Phần mềm Excel thực hiện các công việc theo workbooks,
và mỗi workbook lại có các worksheet, và worksheet là nơi mà chúng ta sẽ liệt kê và
phân tích dữ liệu với Excel. Khi chúng ta bắt đầu khích hoạt phần mềm Excel, một
worksheet trắng sẽ được hiển thị, bao gồm nhiều ổ trên bảng tính. Mỗi ô trên bảng tính
được dẫn chiếu thông qua toạ độ của chúng.

4 THỐNGKÊMÔTẢ

Bộ công cụ Data Analysis Toolpack có một bộ công cụ con để chúng ta có thể tiến hành
thực hiện các phương pháp thống kê mô tả. Để tiến hành tìm các đại lượng trong thống kê
mô tả, ta thực hiện các bước như sau

Bước 1. Từ menu chúng ta chọn Tool, nếu như chúng ta thấy lệnh data analysis có hiển
thị, chúng ta chọn lệnh này, nếu không chúng ta chọn add-ins để cài đặt Analysis
Toolpack như đã nêu ở trên.

Bước 2
. Sau khi đã chon data analysis, chúng ta chọn descriptive statistics.

Copyright© 2008 Development and Policies Research Center (DEPOCEN)

7


Bước 3. Khi xuất hiện cửa sổ Descriptive statistics, chúng ta sẽ nhập khoảng dữ liệu, sau
đó chúng ta sẽ chọn ô để Excel xuất kết quả.



Sau đó bấm OK và xem xét kết quả thu được
Copyright© 2008 Development and Policies Research Center (DEPOCEN)

8


Ta thấy Excel cho ta các đại lượng thống kê mô tả cơ bản như trung bình (mean), độ lệch
chuẩn (standard deviation), phương sai (variance), dải biến thiên (range), số quan sát
(count), giá trị tối đa và giá trị tối thiểu, trung vị (median), sai số chuẩn của trung bình
mẫu (standard error).

5 PHÂNPHỐICHUẨN

Giả sử chúng ta muốn tìm xác suất của một biến X nhận giá trị nhỏ hơn một giá trị nhất
định nào đó. Chúng ta giả sử là điểm số của các cá nhân trong lớp là phân bổ theo phân
phối chuẩn có trị trung bình là 500 và độ lệch chuẩn là 100. Các câu hỏi mà chúng ta phải
trả lời là

a. Xác suất để một sinh viên được chọn ngẫu nhiên có điểm số thấp hơn 600 là bao
nhiêu?
b. Xác suất để một sinh viên được chọn ngẫu nhiên có điểm số cao hơn 600 là bao nhiêu?
c. Xác suất để một sinh viên được chọn ngẫu nhiên có điểm số nằm trong khoảng 400-
600 là bao nhiêu?

Copyright© 2008 Development and Policies Research Center (DEPOCEN)

9
Gợi ý: Khi sử dụng Excel chúng ta có thể tìm được xác suất của một biến X nhận giá trị
nhỏ hơn hoặc bằng một giá trị cho trước nào đó. Và khi chúng ta đã biết trị trung bình và
độ lệch chuẩn, chúng ta phải suy nghĩ một cách “thông minh” để tính toán vì chúng ta
biết rằng tổng xác suất nằm dưới đường cong chuẩn là bằng 1.

Giải đáp

Bước 1. Chọn ô mà ta muốn Excel xuất kết qu
ả, sau đó chọn Insert

Bước 2. Sau khi bấm vào insert chúng ta chọn Function



Bước 3. Sau khi chúng ta bấm vào Function, cửa sổ insert function sẽ xuất hiện. Chúng
ta sẽ chọn statistical, và sau đó chọn Normdist trong số các hàm có sẵn trong Excel

Copyright© 2008 Development and Policies Research Center (DEPOCEN)

10


Bước 4. Sau khi nhấn OK, cửa sổ Normdist sẽ xuất hiện, và chúng ta cung cấp các thông
số cần thiết. Chúng ta điền 600 vào X, 500 vào ô mean, 100 vào ô standard deviation, và
điền true vào ô cumulative box, và sau đó nhấn OK.

Copyright© 2008 Development and Policies Research Center (DEPOCEN)

11


Chúng ta sẽ có kết quả sau



Như chúng ta thấy, xác suất để một học sinh được chọn ngẫu nhiên có số điểm thấp hơn
600 là 0.84134474. Để trả lời được câu b, chúng ta lấy 1 trừ đi con số này và kết quả là
0.158653. Đây là xác suất để một học sinh được chọn ngẫu nhiên có số điểm lớn hơn
600. Thực hiện các bước như trên và suy nghĩ một cách hợp lý chúng ta có thể tính được
xác suất một học sinh được chọn ngẫu nhiên sẽ có số điểm nằm trong khoảng 400-600.
Người đọc nên lấy đây làm bài tập cho chính mình để thực hiện thành thạo các bước ở
trên.
Copyright© 2008 Development and Policies Research Center (DEPOCEN)

12
6 XÂYDỰNGKHOẢNGTINCẬYCHOTRUNGBÌNHTỔNGTHỂ

Giả sử chúng ta muốn xây dưng khoảng tin cậy cho trung bình của một tổng thể. Tuỳ
theo qui mô của mẫu thống kê mà chúng ta có thể sử dụng một trong số các trường hợp
sau

6.1 Khiquimôcủamẫuthốngkêlớn(nlớnhơn30)

Công thức chung để xây dựng khoảng tin cậy cho trung bình tổng thể là

)/(* nSZx ±

trong đó
x
là trung bình mẫu; Z là hệ số khoảng tin cậy chúng ta có thể tìm thấy trong
bảng phân phối chuẩn (ví dụ, hệ số khoảng tin cậy cho khoảng tin cậy 95% là 1.96). S là
độ lệch chuẩn của mẫu và n là kích thước của mẫu (số lượng các quan sát của mẫu).

Chúng ta muốn sử dụng Excel để xây dựng khoảng tin cậy cho trung bình tổng thể dựa
trên các thông tin của mẫu thống kê. Như chúng ta sẽ thấy, để sử dụng đượ
c công thức
trên, chúng ta cân có trung bình mẫu
x
, và biên độ sai số )/(* nSZ . Excel sẽ tính toán
các đại lượng này cho chúng ta. Điều duy nhất mà chúng ta phải làm là cộng biên độ sai
số
)/(* nSZ vào trung bình mẫu
x
để tìm chặn trên của khoảng tin cậy và lấy trung
bình mẫu
x
trừ đi biên độ sai số )/(* nSZ để tìm chặn dưới của khoảng tin cậy.

Sau khi nhập dữ liệu vào Excel, chúng ta lại thực hiện các bước như chúng ta đã thực
hiện đối với việc tính toán các đại lượng thống kê mô tả. Công việc duy nhất khác với
việc tính toán các đại lượng thống kê mô tả là lần này chúng ta sẽ chọn ô confidence
interval (khoảng tin cậy) trong cửa sổ descriptive statistics (thống kê mô tả) và chọn mức
tin cậ
y (confidence level), và trong trường hợp này chúng ta chọn 95%. Các bước cụ thể
như sau
Copyright© 2008 Development and Policies Research Center (DEPOCEN)

13

Bước 1. Nhập dữ liệu: 6, 8, 6.5, 7, 7, 6.5, 8, 6.5, 7, 7, 7.5, 6, 6, 6, 7.5, 8, 7, 6.5, 7, 8, 6, 6,
6.5, 7, 8, 7.5.

Bước 2. Chọn Tool và sau đó chọn Data Analysis, rồi chọn Descriptive Statistics



Bước 3. Trên cửa sổ Descriptive statistics, chúng ta chọn Summary Statistics. Sau khi
chúng ta đã thực hiện các bước này, chúng ta chọn confidence interval và chọn mức tin
cậy là 95%. Ở mục chọn ô để Excel xuất kết quả, chúng ta có thể chọn ô bất kỳ không
trùng đè lên các dữ liệu.

Copyright© 2008 Development and Policies Research Center (DEPOCEN)

14



Sau khi bấm OK, chúng ta sẽ nhận được kết quả như sau.



Như chúng ta thấy, trung bình của mẫu là
94.6
=
x và giá trị tuyệt đối của sai số
2997.0)/(* =± nSZ . Khoảng tin cậy 95% có chặn trên là 6.94+0.2997 và chặn dưới

Không có nhận xét nào:

Đăng nhận xét