Vận dụng dãy số thời gian trong thống kê vào việc tính chỉ số của một số chỉ tiêu kinh tế.

       1. Đặt vấn đề
       Vật chất luôn luôn vận động không ngừng và biến đổi theo thời gian. Để nghiên cứu sự biến động của kinh tế xã hội, người ta thường sử dụng dãy số thời gian. Dãy số thời gian là dãy các trị số của chỉ tiêu thống kê được sắp xềp theo thứ tự thời gian. Dãy số thời gian cho phép thống kê học nghiên cứu đặc điểm biến động của hiện tượng theo thời gian vạch rõ xu hướng và tính quy luật của sự biến động, đồng thời dự đoán các mức độ của hiện tượng trong tương lai.

       Dãy số thời gian gồm hai thành phần: thời gian và chỉ tiêu của hiện tượng được nghiên cứu. Thờt gian có thể đo bằng ngày, tháng, năm,…tuỳ theo mục đích nghiên cứu. Đơn vị thời gian phải đồng nhất trong dãy số thời gian. Độ dài thời gian giữa hai thời gian liền nhau được gọi là khoảng cách thời gian. Chỉ tiêu về hiện tượng được nghiên cứu là chỉ tiêu được xây dựng cho dãy số thời gian. Các trị số của chỉ tiêu được gọi là các mức độ của dãy số thời gian. Các trị số này có thể là tuyệt đối , tương đối hay bình quân.

       Các mức độ của dãy số thời gian có thể là số tuyệt đối, số tương đối hoặc số bình quân. Dãy số thời gian cho phép thống kê nghiên cứu xu hướng biến động của hiện tượng qua thời gian, đặc biệt là biến động mùa vụ. Người dùng luôn quan tâm đến dữ liệu tần suất nhanh (tuần, tháng, quý) để hiểu rõ hơn những thay đổi của các hiện tượng theo thời gian. Dãy số liệu tháng, quý của các chỉ tiêu thống kê thường bị ảnh hưởng của yếu tố mùa vụ. Đây là yếu tố làm che khuất các biến động cơ bản thực sự của chuỗi dữ liệu liên quan đến chu kỳ kinh doanh hoặc các sự kiện không mang tính chất mùa vụ. Cùng với dữ liệu đã được cơ quan Thống kê công bố, các nhà kinh tế, nhà hoạch định chính sách, người dùng thường quan tâm đến dữ liệu đã được loại bỏ yếu tố mùa vụ nhằm thấy rõ đặc điểm của các chuyển động mùa vụ, đặc biệt là thay đổi trong chiều hướng của số liệu. Nghiên cứu về dãy số thời gian của chỉ tiêu điều chỉnh mùa vụ có ý nghĩa quan trọng, nhằm thấy rõ hơn bản chất của hiện tượng nghiên cứu thông qua những biến động trong ngắn hạn (tháng, quý) dựa trên mô hình phân tích các thành phần của dãy số thời gian để từ đó nắm vững và phân tích kết quả điều chỉnh mùa vụ tốt hơn.

Ghi chú: Sinh viên ngành kinh tế thực hành tính bài tập về dãy số thời gian.

       2. Mô hình phân tích dãy số thời gian

       Phân tích dãy số thời gian (time series analysis) là phương pháp phân tích số liệu thống kê về các quá trình đã diễn ra, được ghi chép theo các khoảng thời gian nối tiếp nhau với mục tiêu sử dụng kinh nghiệm thu được trong quá khứ để dự báo tình hình sẽ xảy ra trong tương lai bất định. Như vậy, thông tin dưới dạng dãy số thời gian có thể phục vụ cho các mục tiêu dự báo.
Chúng ta có thể chia ra những biến động trong dãy số thời gian thành 4 loại hình biến thiên cơ bản. Những thành tố này đồng thời tác động tới dãy số thời gian. Cụ thể, chúng ta có:

       * Xu thế (T): phản ánh xu hướng biến động cơ bản của hiện tượng qua thời gian. Mặc dù các mức độ của hiện tượng có thể dao động thay đổi tại các mốc thời gian khác nhau nhưng nếu quan sát hiện tượng trong cả một quá trình dài (thường trên một năm), ta sẽ thấy hiện tượng có xu hướng biến động cơ bản tăng hoặc giảm.

       * Biến động chu kỳ (C): phản ánh quy luật lặp lại của dãy số trong những khoảng thời gian nhất định thường là vài năm. Chu kỳ tác động lên dãy số thời gian thường là chu kỳ kinh tế hay kinh doanh như chu kỳ suy thoái kinh tế, lạm phát hay vòng đời của sản phẩm. Nghiên cứu biến động chu kỳ đòi hỏi dãy số thời gian có độ dài trên một năm.

       * Biến động thời vụ (S): là những biến động của hiện tượng có tính chất lặp đi lặp lại trong từng thời gian nhất định của năm. Nguyên nhân gây ra là do ảnh hưởng của điều kiện tự nhiên như thời tiết, khí hậu, phong tục tập quán sinh hoạt của dân cư. Khác với xu thế và biến động chu kỳ, khi nghiên cứu biến động thời vụ ta phải nhìn vào quy luật lặp lại của hiện tượng trong từng năm một.

       * Biến động bất quy tắc (I): là do các yếu tố ngẫu nhiên gây ra. Loại biến động này thường rất khó dự báo do tính chất bất thường của nó. Bên cạnh đó, sự tồn tại của biến động ngẫu nhiên còn làm lu mờ tính quy luật của các thành phần còn lại trong dãy số khiến cho việc dự báo các thành phần này trở nên khó khăn hơn. Sự kết hợp giữa các thành phần của dãy số thời gian được thể hiện dưới hai dạng phổ biến là:

Mô hình 1. Mô hình kết hợp theo dạng cộng: Y = T + S + I

Mô hình 2. Mô hình kết hợp theo dạng nhân: Y = T x S x I

       Việc lựa chọn mô hình nào tùy thuộc vào đặc điểm biến động của từng dãy số. Cụ thể, nếu mức độ biến động theo thời vụ của các mốc thời gian trước đó bằng với mức độ biến động theo thời vụ của các mốc thời gian là bằng nhau, đường xu hướng là đường thẳng tuyến tính đi lên hoặc đi xuống, các biến động có thể định lượng được bằng con số cụ thể thì sử dụng mô hình cộng là phù hợp. Tuy nhiên nếu biến động mùa vụ thay đổi theo thời gian, yếu tố mùa vụ phụ thuộc vào yếu tố xu hướng và yếu tố chu kỳ thì nên sử dụng mô hình nhân.

       Phương pháp phân tích dãy số thời gian tập trung vào việc tách ảnh hưởng của từng thành tố trên của dãy số thời gian với mục tiêu sử dụng nó để dự báo về tương lai. Để xác định xu thế chung trong một dãy số thời gian, các nhà thống kê có thể sử dụng phương pháp phân tích hồi quy, nghĩa là xác định một đường phù hợp với các giá trị quan sát của dãy số thời gian bằng phương pháp bình phương nhỏ nhất. Ở đây, thời gian được coi là biến độc lập trong phương trình hồi quy ước lượng được và biến quan sát được coi là biến phụ thuộc. Ngoài ra, các nhà thống kê có thể sử dụng phương pháp bình quân di động để san bằng dãy số thời gian, qua đó xác định xu thế cơ bản của nó. Chẳng hạn, họ sử dụng số bình quân di động 5 thời kỳ thông qua việc thay thế mỗi giá trị quan sát nối tiếp bằng một số bình quân của giá trị quan sát đó và hai giá trị quan sát trước và sau nó.

       Phương pháp san bằng mũ số là một phương pháp khác để san bằng dãy số thời gian. Phương pháp này tương tự như phương pháp bình quân di động, nhưng các giá trị quan sát gần hơn được gia quyền lớn hơn khi tính số bình quân. Để xác định ảnh hưởng của biến động thời vụ, các nhà thống kê thiết lập chỉ tiêu biến động thời vụ, gọi là chỉ số thời vụ, và sử dụng nó để loại trừ tính thời vụ trong dãy số thời gian. Qua đó, người ta chỉ ra được rằng nếu không có những biến động thời vụ thì dãy số thời gian sẽ ra sao. Sau khi xác định được xu thế, người ta có thể ngoại suy xu thế đó và ước lượng giá trị xu thế của các thời kỳ tương lai. Chẳng hạn trong hình, xu thế cho đến thời kỳ t, bao hàm cả t, có thể dùng để ngoại suy cho thời kỳ t+1. Bởi vậy, ngoại suy trở thành phương pháp dự báo, mặc dù độ chính xác của giá trị dự báo còn phụ thuộc vào chỗ trong tương lai những yếu tố cơ bản tác động tới dãy số thời gian trong quá khứ có tiếp tục tác động theo phương thức cũ không.

       3. Ứng dụng của dãy số thời gian trong kinh tế

       Dãy số thời gian có rất nhiều ứng dụng quan trọng trong các lĩnh vực khác nhau như kinh doanh, kinh tế, y tế, và khoa học môi trường. Các ứng dụng này giúp chúng ta hiểu rõ hơn về các xu hướng và mô hình trong dữ liệu theo thời gian, từ đó đưa ra các dự báo và quyết định chiến lược. Dưới đây là một số ứng dụng cụ thể của dãy số thời gian:

       a. Dự báo kinh tế: 

       Dãy số thời gian được sử dụng rộng rãi trong dự báo kinh tế. Các nhà kinh tế học sử dụng các mô hình dãy số thời gian để dự báo GDP, lạm phát, tỷ lệ thất nghiệp và các chỉ số kinh tế khác. Ví dụ, mô hình ARIMA (Auto-Regressive Integrated Moving Average) là một trong những mô hình phổ biến để dự báo xu hướng kinh tế.

       b. Quản lý chuỗi cung ứng:

       Trong quản lý chuỗi cung ứng, dãy số thời gian được sử dụng để dự báo nhu cầu sản phẩm, từ đó tối ưu hóa việc tồn kho và sản xuất. Bằng cách phân tích dữ liệu lịch sử về doanh số bán hàng, các công ty có thể dự đoán nhu cầu tương lai và giảm thiểu chi phí liên quan đến hàng tồn kho.

       c. Phân tích thị trường tài chính:

        Các nhà đầu tư và phân tích tài chính sử dụng dãy số thời gian để dự báo giá cổ phiếu, tỷ giá hối đoái, và các chỉ số tài chính khác. Các mô hình như GARCH (Generalized Autoregressive Conditional Heteroskedasticity) giúp đo lường và dự báo biến động của giá cả trên thị trường tài chính.

       d. Y tế và khoa học đời sống: 

Trong lĩnh vực y tế, dãy số thời gian được sử dụng để theo dõi và dự báo sự lây lan của bệnh dịch, phân tích xu hướng trong dữ liệu bệnh nhân, và đánh giá hiệu quả của các phương pháp điều trị. Ví dụ, mô hình SEIR (Susceptible, Exposed, Infectious, Recovered) giúp dự báo sự lây lan của các bệnh truyền nhiễm.

       e. Khoa học môi trường: 

       Dãy số thời gian cũng được ứng dụng trong việc theo dõi và dự báo các hiện tượng môi trường như nhiệt độ, lượng mưa, và chất lượng không khí. Các mô hình thời gian giúp các nhà khoa học dự báo biến đổi khí hậu và các hiện tượng thời tiết cực đoan.

       f. Đặc biệt các nhà kinh tế thường Vận dụng mô hình cộng tính chỉ số mùa vụ của chỉ tiêu tổng sản phẩm trong nước

       Tổng sản phẩm trong nước (Gross Domestic Product – GDP) là chỉ tiêu kinh tế tổng hợp đánh giá kết quả hoạt động sản xuất trong phạm vi lãnh thổ kinh tế của một quốc gia. GDP là chỉ tiêu kinh tế quan trọng, được các nhà quản lý, các nhà kinh tế, nhà đầu tư cũng như các chuyên viên phân tích thị trường theo dõi rất chặt chẽ vì đó là chỉ tiêu phản ánh tổng giá trị của tất cả sản phẩm vật chất và dịch vụ cuối cùng được tạo ra của một nền kinh tế trong khoảng thời gian cụ thể. Chỉ tiêu GDP thể hiện rõ rệt yếu ố mùa vụ, đó là GDP thường tăng cao vào các tháng, quý cuối năm do nhu cầu sản xuất, tiêu dùng tăng mạnh để chuẩn bị cho dịp Lễ Tết cuối năm. Do đó cần điều chỉnh mùa vụ đối với chỉ tiêu GDP thông qua tính chỉ số mùa vụ để thấy rõ hơn sự biến động của chỉ tiêu này trong từng thời gian cụ thể, cung cấp thông tin cho Lãnh đạo các cấp, các ngành thấy được sự phát triển của nền kinh tế, qua đó phân bổ nguồn lực cho các hoạt động sản xuất, kinh doanh của nền kinh tế một cách phù hợp và hiệu quả.

       Với số liệu tổng sản phẩm trong nước (GDP) của Việt Nam trong giai đoạn 2019- 2022, khi thực hiện phân tích dãy số khi các thành phần của nó kết hợp theo mô hình cộng. Để tính chỉ số thời vụ theo mô hình cộng, các bước thực hiện như sau:

       - Bước 1: Tính xu thế T bằng phương pháp bình quân trượt.

       Số lượng các mức độ được chọn s thường là 4 nếu là số liệu quí và 12 nếu là số liệu tháng
       Các mức độ của dãy số trung bình trượt được tính theo công thức:

       Bên cạnh đó có thể xác định theo cách như sau:

       Tính trung bình trượt lần thứ nhất với mỗi nhóm gồm 4 mức độ (số liệu quý). Dễ dàng nhận thấy rằng, khi tính số bình quân trượt cho một nhóm gồm lẻ các mức độ, giá trị của nó được đặt vào vị trí giữa của nhóm các mức độ tham gia tính toán. Nhưng với nhóm gồm chẵn mức độ, vị trí của số trung bình sẽ không gắn liền với một mốc thời gian nào cả.

       Chẳng hạn, với số trung bình trượt đầu tiên được tính bằng cách lấy

       (931.831+1.1291.088+1.270.212+1.674.845+1.674.845)/4=1.251.494 tỷ đồng.

       Vị trí của số này sẽ nằm ở giữa mức độ thứ hai (1.129.088) và mức độ thứ ba (1.270.212) của dãy số đầu tiên.

       Khi đó, ta phải tính trung bình trượt lần 2 cho nhóm 2 mức độ của dãy số bình quân trượt vừa tính được nhằm mục đích đặt các giá trị bình quân trượt tương ứng với các mốc thời gian cụ thể.

       Như vậy, mức độ đầu tiên của dãy số trung bình trượt lần 2 được tính:

       (1.251.494+1.275.691)/2=1.263.592.

       Tương tự, ta tính tiếp các mức độ còn lại. Dãy số này sẽ mất 2 số hạng đầu và 2 số hạng cuối.

       - Bước 2: Loại bỏ xu thế. Dựa vào mô hình cộng kết hợp các thành phần của dãy số thời gian, loại bỏ xu thế theo công thức: S+I= Y-T.

       Kết quả còn lại là hai thành phần: biến động thời vụ S và biến động ngẫu nhiên I như ở bảng sau đây:

       Bảng 1: Kết quả tính thành phần biến động mùa vụ và ngẫu nhiên của dãy số thời gian GDP

       - Bước 3: Loại bỏ biến động ngẫu nhiên bằng cách tính giá trị bình quân cho mỗi thời vụ.

       -    Bước 4: Tính chỉ số mùa vụ

       Kết quả tính được là giá trị bình quân mỗi quí chưa điều chỉnh mùa vụ.

       - Về nguyên tắc, biến động mùa vụ xung quanh xu thế phải bù trừ triệt tiêu lẫn nhau. Do đó tổng của biến động mùa vụ là bằng 0. Với số liệu trên, tổng của trung bình quí chưa điều chỉnh là bằng -147.131. Vậy phải điều chỉnh lại cho tổng của biến động mùa vụ bằng 0. Như vậy, tính trung bình, mỗi quí sẽ phải điều chỉnh một hệ 147.131/4= 36.783. Chỉ số mùa vụ điều chỉnh được tính bằng cách lấy trung bình của mỗi quí cộng thêm hệ số điều chỉnh.

Bảng 3: Chỉ số điều chỉnh mùa vụ

       Kết quả tính toán cho thấy GDP của Việt Nam ở quí 1 và quí 2 thấp hơn xu thế tương ứng là 288.482 tỷ đồng và 103.164 tỷ đồng. Trong khi đó quí 3 và quí 4 lại cao hơn xu thế tương ứng là 49.471 tỷ đồng và 342.175 tỷ đồng. Kết quả này cũng phản ánh đúng thực tế của nền kinh tế Việt Nam, thể hiện tính thời vụ trong các hoạt động sản xuất kinh doanh của nền kinh tế khi quý III và quý IV tăng tốc sản xuất để phục vụ nhu cầu tiêu dùng, xuất khẩu tăng mạnh vào dịp Tết Dương lịch và Tết Âm lịch.

Ghi chú: Mô hình khái quát về dãy số thời gian trong thống kê.

       4. Kết luận

       Thông qua các ứng dụng trên đã chỉ ra rằng dãy số thời gian có thể được áp dụng trong nhiều lĩnh vực khác nhau từ quản lý nhân sự, kinh doanh đến dự báo kinh tế. Việc phân tích dãy số thời gian giúp doanh nghiệp và các tổ chức đưa ra quyết định dựa trên dữ liệu quá khứ và xu hướng tương lai. Dãy số thời gian là một công cụ quan trọng trong thống kê học, cho phép chúng ta nghiên cứu các đặc điểm và biến động của các hiện tượng theo thời gian. Qua việc phân tích dãy số thời gian, chúng ta có thể:

       Xác định xu hướng phát triển của hiện tượng.

       Phát hiện các quy luật biến động.

       Dự đoán các mức độ của hiện tượng trong tương lai.

       Dãy số thời gian không chỉ giúp chúng ta hiểu rõ hơn về quá khứ mà còn cung cấp công cụ để dự đoán và chuẩn bị cho tương lai. Việc phân tích và áp dụng đúng cách dãy số thời gian sẽ mang lại những lợi ích lớn cho việc quản lý và ra quyết định trong nhiều lĩnh vực khác nhau.

Phạm Thị Huyền - Khoa khoa học Cơ bản

       Tài liệu tham khảo
       Dagum, E. B., “Phương pháp điều chỉnh mùa vụ X-13-ARIMA”, Cơ quan Thống kê Ca-na-đa, Ottawa, 1980.

       Macaulay, R.F., “Làm trơn dãy số thời gian”, Cục Kinh tế Mỹ, New York, 2015.