标签 数学建模 下的文章

一、作业要求(数据文件homework.dta)

  • 画出ln_wage和tenure的散点图以及拟合曲线。
  • 以ln_wage为被解释变量,以age、race、msp、grade、south、union为解释变量,做描述性统计分析,给出变量之间的相关性水平,做普通最小二乘回归(报告估计系数、t统计值、F值、R2、观测值个数),以上结果以表格形式输出。
  • 以ln_wage为被解释变量,以age、msp、south、union为解释变量,做个体固定效应回归(在idcode层面做聚类稳健标准误),以表格形式输出回归结果,报告组间R2。
  • 以ln_wage为被解释变量,以age、msp、south、union为解释变量,做个体随机效应回归,以表格形式输出回归结果,报告组内R2。
  • 利用hausman检验判断应该是个体固定效应回归还是个体随机效应回归,报告hausman统计值。
  • 数据文件下载地址

二、代码文件如下(如有错误,请指正)

*切换路径*
clear
cd "F:\数学建模\计量经济学\homework" //数据文件所在目录
set more off
use homework.dta //使用homework.dta
*1.1绘制ln_wage和tenure散点图*
scatter ln_wage tenure
*1.2绘制ln_wage和tenure拟合优度*
twoway (lfit ln_wage tenure)
*补充:ln_wage和tenure散点图和拟合优度复合*
twoway (scatter ln_wage tenure ) (lfit ln_wage tenure)
*2.1.1给出一般描述性统计结果*
su ln_wage age race msp grade south union,de
*2.1.2给出详细描述性统计结果*
tabstat ln_wage age race msp grade south union, stat( mean sd p5 p25 med p75 p95 min max )
*2.2给出变量之间的相关性水平*
pwcorr   ln_wage age race msp grade south union,star(0.05)
*2.3普通最小二乘回归*
reg ln_wage age race msp grade south union
*2.4使用outreg2命令输出结果*
est store Result
//保留R²,F统计量,样本回归系数(保留三位小数),T统计量(保留两位小数)
outreg2 [Result] using Result.xsl, replace tstat e(r2,F) bdec(3) tdec(2)
*3.1告诉stata该数据为面板数据(工资ln_wage和年份year)*
xtset idcode year
*3.2个体固定效应回归(在idcode层面做聚类稳健标准误)*
xtreg ln_wage age msp south union ,fe vce(cluster idcode)
*3.3输出结果,汇报组间R² *
est store Xtreg_Fe
outreg2 [Xtreg_Fe] using Xtreg_Fe.xsl, replace tstat e(r2_b) 
*4.1个体随机效应回归(在idcode层面做聚类稳健标准误)*
xtreg ln_wage age msp south union i.year,re vce(cluster idcode)
*4.2输出结果,汇报组内R² *
est store Xtreg_Re
outreg2 [Xtreg_Re] using Xtreg_Re.xsl, replace tstat e(r2_w) 
*利用hausman检验判断应该是个体固定效应回归还是个体随机效应回归*
//个体固定回归(不做聚类稳健标准误)
xtreg ln_wage age msp south union ,fe 
est store Xtreg_Fe_1
//个体随机回归(不做聚类稳健标准误)
xtreg ln_wage age msp south union i.year,re
est store Xtreg_Re_1
//计算hausman
hausman Xtreg_Fe_1 Xtreg_Re_1,constant sigmamore

三、数据结果的图文说明

切换路径*
clear
cd "F:\数学建模\计量经济学\homework" //数据文件所在目录
set more off
use homework.dta  //使用homework.dta 

1. 画出ln_wage和tenure的散点图以及拟合曲线。

1.1绘制ln_wage和tenure散点图*
scatter ln_wage tenure

img

1.2绘制ln_wage和tenure拟合优度*
twoway (lfit ln_wage tenure)

img

补充:ln_wage和tenure散点图和拟合优度复合*
twoway (scatter ln_wage tenure) (lfit ln_wage tenure)

img

2. 以ln_wage为被解释变量,以age、race、msp、grade、south、union为解释变量,做描述性统计分析,给出变量之间的相关性水平,做普通最小二乘回归(报告估计系数、t统计值、F值、R2、观测值个数),以上结果以表格形式输出。

2.1.1给出一般描述性统计结果*
su ln_wage **age race msp grade south union,**de
*2.1.2给出详细描述性统计结果*
tabstat ln_wage **age race msp grade south union,** stat**(** mean sd p5 p25 med p75 p95 min max **)

img

2.2给出变量之间的相关性水平*
pwcorr  ln_wage **age race msp grade south union,**star**(0.05)

img

2.3普通最小二乘回归*
reg ln_wage **age race msp grade south union**
*2.4使用outreg2命令输出结果*
est store **Result**
//保留R²,F统计量,样本回归系数(保留三位小数),T统计量(保留两位小数)
outreg2 **[Result] using** Result.xsl**, replace** tstat **e(r2,F) bdec(3) tdec(2)

回归结果如下:

img

结果报告:**
​                    **age   race  msp   grade  south  union  Constant**
**估计系数:[0.009]  [-0.051] [-0.016] [0.078] [-0.124]  [0.182]  [0.552]**
**T统计量:(-19.65)  (-8.03) (-2.60)  (-62.33) (-20.02) (-26.05) (-23.75)**
​    **F值:1145**                  **R2:0.263**                 **Obs:19213

3. 以ln_wage为被解释变量,以age、msp、south、union为解释变量,做个体固定效应回归(在idcode层面做聚类稳健标准误),以表格形式输出回归结果,报告组间R2。

*3.1告诉stata该数据为面板数据(工资ln_wage和年份year)*
xtset idcode year
*3.2个体固定效应回归(在idcode层面做聚类稳健标准误)*
xtreg ln_wage age msp south union ,fe vce(cluster idcode)

img

*3.3输出结果,汇报组间R² *
est store Xtreg_Fe
outreg2 [Xtreg_Fe] using Xtreg_Fe.xsl, replace tstat e(r2_b)

结果如下:

img

结果报告:组间R2的值为 0.0711

4. 以ln_wage为被解释变量,以age、msp、south、union为解释变量,做个体随机效应回归,以表格形式输出回归结果,报告组内R2。

***4.1****个体随机效应回归(在****idcode****层面做聚类稳健标准误)*******
xtreg ln_wage age msp south union i.year**,**re **vce(**cluster **idcode)

img

***4.2****输出结果,汇报组内****R² \***
est **store** Xtreg_Re
outreg2 **[**Xtreg_Re**] using** Xtreg_Re.xsl**,** replace **tstat e(r2_w)

结果如下:

img

结果报告:组内R2的值为 0.101

5. 利用hausman检验判断应该是个体固定效应回归还是个体随机效应回归,报告hausman统计值

*****利用****hausman****检验判断应该是个体固定效应回归还是个体随机效应回归*******
**//****个体固定回归(不做聚类稳健标准误)**
xtreg **ln_wage age msp south union ,**fe 
est **store Xtreg_Fe_1

img

//****个体随机回归(不做聚类稳健标准误)**
xtreg ln_wage age msp south union **i.year,**re
est **store** Xtreg_Re_1

img

//****计算****hausman**
hausman Xtreg_Fe_1 Xtreg_Re_1**,constant** sigmamore

img

hausman结果报告: chi2值为107.18 ,同时 P统计量 = 0.000 < 0.05结果显著。**
​                  **拒绝原假设(H0:** **个体随机效应回归),采用(个体固定效应回归)

++++++++++++++++++++++++++ 计量经济学 Copyright By © 学金融的文科生 ++++++++++++++++++++++++++

一、ACF(自相关系数检验周期)

%% 通过autocorr和xcorr自相关求周期
clear ;clc
%加载TOP13家供货商240周的供货量数组文件
load FFt.mat;
%使用autocorr函数
Randi = randi([2 14],1,1)
A = FFt([1:96],Randi) ;
len = length(A) ;
[ACF,lags,bounds] = autocorr(A,len-1) ;
subplot(2,1,1) ;
plot(lags(1:end),ACF(1:end)) ;
title('autocorr求S-top13的自相关') ;
%使用xcorr函数
B = A - mean(A) ;%减掉均值
[c,lags] = xcorr(B) ;
d = c ./ c(len) ;%归一化
subplot(2,1,2) ;
plot(lags(len:end),d(len:end)) ;%取中点n为起始的后面n个序列
title('xcorr求S-top13的自相关') ;
from statsmodels.tsa.stattools import acf

# Expected time period
for lag in fft_periods:
    # lag = fft_periods[np.abs(fft_periods - time_lag).argmin()]
    acf_score = acf(data["value"].values, nlags=lag)[-1]
    print(f"lag: {lag} fft acf: {acf_score}")

expected_lags = np.array([timedelta(hours=12)/timedelta(minutes=5), timedelta(days=1)/timedelta(minutes=5), timedelta(days=7)/timedelta(minutes=5)]).astype(int)
for lag in expected_lags:
    acf_score = acf(data["value"].values, nlags=lag, fft=False)[-1]
    print(f"lag: {lag} expected acf: {acf_score}")

周期检验图

1.autocorr求S-top13的自相关

2.corr求S-top13的自相关

xcorr求S-top13的自相关

二、FFt(傅里叶变换计算周期)

%% 判断TOP13家供货商的供货量(S)是否为周期波动。如果周期波动,求出周期。
clear;clc;
%加载TOP13家供货商240周的供货量数组文件
load FFt.mat;
%将首列的240个周次作为横坐标(Weeks)
weeks = FFt([1:240],1);
%随机生成2到14中的一个整数用以随机择取13个供货商中的一家
Randi = randi([2 14],1,1)
SNumbers = FFt([1:240],Randi);
%绘制该供货商未经fft(傅里叶函数)变换的原始图像并观察是否存在周期此性
plot(weeks,SNumbers)
xlabel('Weeks')
ylabel('SNumbers')
title('FFt Data')
%大致判断该原始图像是否具有周期性
judge = input("请输入观察该供货商的供货量(S)数据是否具有周期性,'是'请输入'1','不是'请输入'0':")
if judge == 1
    %如果具有周期性,则使用FFt(傅里叶变换)函数将随机择取的供货商所在列的供货量(S)进行变换
    y = fft(SNumbers);
    y(1) = [];
    plot(y,'ro')
    %绘制经过fft(傅里叶函数)变换后的图像
    xlabel('real_SNumbers(y)')
    ylabel('imag_SNumbers(y)')
    title('傅里叶转换')
    %变换数据前半部分的幂
    n = length(y);
    power = abs(y(1:floor(n/2))).^2;
    %最大频率
    maxfreq = 1/2;      
    %等距频率网格
    freq = (1:n/2)/(n/2)*maxfreq;    
    plot(freq,power)
    xlabel('Weeks/Cycle')
    ylabel('Power')
    period = 1./freq;
    plot(period,power);
    %放大最大功率(周次)
    xlim([0 240]); 
    xlabel('Weeks/Cycle')
    ylabel('SNumbers')
end

随机验证周期图

1.Weeks

Weeks

2.Weeks_Cycle

Weeks_Cycle

三、Topsis

(一)Inter2Max

%% 定义Inter2Max函数以备主函数调用
function [posit_x] = Inter2Max(x,a,b)
    r_x = size(x,1);  % row of x 
    M = max([a-min(x),max(x)-b]);
    posit_x = zeros(r_x,1);  
    % 初始化posit_x全为0
    for i = 1: r_x
        if x(i) < a
           posit_x(i) = 1-(a-x(i))/M;
        elseif x(i) > b
           posit_x(i) = 1-(x(i)-b)/M;
        else
           posit_x(i) = 1;
        end
    end
end

(二)Mid2Max

%% 中间型数据转极大型数据
%定义Mid2Max函数以备主函数调用
function [posit_x] = Mid2Max(x,best)
    M = max(abs(x-best));
    posit_x = 1 - abs(x-best) / M;
end```
%% 中间型数据转极大型数据
%定义Mid2Max函数以备主函数调用
function [posit_x] = Mid2Max(x,best)
    M = max(abs(x-best));
    posit_x = 1 - abs(x-best) / M;
end

(三)Min2Max

%% 及小型数据转极大型数据
%定义Min2Max函数以备主函数调用
function [posit_x] = Min2Max(x)
    posit_x = max(x) - x;
    % posit_x = 1 / x; 如果x全部都大于0,需要这样正向化
end

(四)Positivization

%% 调用Mid2Max.m和Min2Max.m和Inter2Max.m函数定义正向化函数
function [posit_x] = Positivization(x,type,i)
% 输入变量有三个:
% x:需要正向化处理的指标对应的原始列向量
% type: 指标的类型(1:极小型, 2:中间型, 3:区间型)
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示:正向化后的列向量
    if type == 1  %极小型
        disp(['第' num2str(i) '列是极小型,正在正向化'] )
        posit_x = Min2Max(x);  %调用Min2Max函数来正向化
        disp(['第' num2str(i) '列极小型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 2  %中间型
        disp(['第' num2str(i) '列是中间型'] )
        best = input('请输入最佳的那一个值: ');
        posit_x = Mid2Max(x,best);
        disp(['第' num2str(i) '列中间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 3  %区间型
        disp(['第' num2str(i) '列是区间型'] )
        a = input('请输入区间的下界: ');
        b = input('请输入区间的上界: '); 
        posit_x = Inter2Max(x,a,b);
        disp(['第' num2str(i) '列区间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    else
        disp('没有这种类型的指标,请检查Type向量中是否有除了1、2、3之外的其他值')
    end
end

(五)topsis

%% Step1:清空界面,并加载矩阵X
clear;clc %清空界面
load X.mat %加载数据
%% Step2:判断是否需要正向化处理
[n,m] = size(X);%计算矩阵的大小
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) %输出共有多少个评价对象
JUDGING = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0:  ']);%定义是否需要正向化处理
if JUDGING == 1
    Position = input('请输入需要正向化处理的指标所在的列 '); 
    disp('请输入需要处理的这些列的指标类型(1-极小型, 2-中间型, 3-区间型) ')
    TYPE = input('例如:第1列是极小型,第2列是中间型,第3列是区间型,就输入[1,2,3]:  ');%同样为了保证代码逻辑的完整性,此处添加正向化的处理步骤
      for i = 1 : size(Position,2)  %这里需要对这些列分别处理,因此需要知道一共要处理的次数,即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),TYPE(i),Position(i));
       end
    disp('正向化后的矩阵 X =  ')%输出正向化的矩阵
    disp(X)
end%以end作为结尾
%% Step3:对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);%利用repmat函数
disp('标准化矩阵 Z = ')%输出标准化矩阵Z
disp(Z)
%% Step4:判断是否需要增加权重
disp("请输入是否需要增加权重向量,需要输入1,不需要输入0")%以此作为增加权重步骤的开始
JUDGING = input('请输入是否需要增加权重: ');%判断是否需要增加权重
if JUDGING == 1%用if 和 for 循环来判断是否需要增加权重
    JUDGING = input('使用熵权法确定权重请输入1,否则输入0: ');%确定是否需要用熵权法增加权重
    if JUDGING == 1%==是判断符号
        if sum(sum(Z<0)) >0   % 如果之前标准化后的Z矩阵中存在负数,则重新对X进行标准化
            disp('原来标准化得到的Z矩阵中存在负数,所以需要对X重新标准化')
            for i = 1:n%使用for循环
                for j = 1:m
                    Z(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];
                end
            end
            disp('X重新进行标准化得到的标准化矩阵Z为:  ')
            disp(Z)
        end
        weight = Entropy_Method(Z);
        disp('熵权法确定的权重为:')%输出最终权重数据
        disp(weight)
    else
        disp(['如果你有3个指标,你就需要输入3个权重,例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);
        weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);
        OK = 0;  % 用来判断用户的输入格式是否正确
        while OK == 0 
            if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m  % 注意,Matlab中浮点数的比较要小心
                OK =1;
            else
                weight = input('你输入的有误,请重新输入权重行向量: ');
            end
        end
    end
else
    weight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同,即都为1/m
end

%% Step5:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   %此为与最大值即最优解的距离
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   %此为与最小值即最劣解的距离
S = D_N ./ (D_P+D_N);    % 这里得到未归一化的得分
disp('最后的得分为:')
stand_S = S / sum(S)%将数据进行归一化处理,以便于比较。
[sorted_S,index] = sort(stand_S ,'descend')%对各个供应商进行排序,得到最终数据

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3svr12kkscyss