有效沟通问答-【官方】百战程序员_IT在线教育培训机构

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 128778个问题

时间排序推荐排序

老师，我不明白我们需要求的是参数W0和W1，但为什么我们又需要写“y = 4 + 3*X + np.random.randn(100, 1)”里面的W0和W1呢？这个因果关系究竟是怎么样的？

人工智能/第五阶段：机器学习-线性回归/梯度下降法 76楼

老师，有2个问题想问问：

1）我们怎么能判断得出收敛是在极值附近震荡，而不是已经收敛了呢？就是数值上有什么样的特征吗？因为就算是震荡，但其实也是一直在下降减少的。

2）如果处于鞍点时，其实梯度也会下降，但是按照我们设置的跳出循环的阈值条件，也会容易造成误判而跳出，以为已经求解出最优解了。这个问题怎么解决或者怎么观察和判断去避免这个？

人工智能/第五阶段：机器学习-线性回归/梯度下降法 77楼

老师，我看某些帖子，有把g部分写成图二的样子。想问问图一中，h_theta_x - y, X_j和g_j的形状吗？另外，能不能提供一个简单的theta, h_theta_x - y和X_j的形状例子，方便理解。

人工智能/第五阶段：机器学习-线性回归/梯度下降法 78楼

老师，业务中threshold一般怎么设置多少？

人工智能/第五阶段：机器学习-线性回归/梯度下降法 79楼

老师，那是不是学习率首先可以按应用算法的种类来做判断设置数值的大小？因为ML和DL的损失函数的凹凸性是决定性的。

另外，我还有一个疑问，虽然我们未必需要全局最优解，那是不是每次运行完得到一组最优解参数，再套过去测试集看看准确率，如果符合预期那就可以了，否则就继续改变学习率，看看是不是能得到另组最优解，然后继续测试。流程是不是这样子？

人工智能/第五阶段：机器学习-线性回归/梯度下降法 80楼

老师，不知道这么理解对不对：是不是面对所有的凸函数（其中一个判断方法：函数二阶导大于0为凸函数，反之为凹函数），我们都可以直接应用解析解的方式直接一步到位求解出模型Theta？虽然我知道机器学习和业务例子上很难有那么直接应用的例子，更多时候还是应用类似梯度下降之类的算法，迭代去逼近求取最优解的Theta，即对应MSE/Loss为最小时。

人工智能/第五阶段：机器学习-线性回归/梯度下降法 81楼

老师这里边真实值是确定的数

预测值是根据什么预测的呢，是要根据这个a，b吗？，可是ab是不确定的啊

a，b确定的话再怎么找最优的a，b呢

人工智能/第五阶段：机器学习-线性回归/多元线性回归 82楼

import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

np.random.seed(42)

X1 = 2*np.random.rand(100,1)
X2 = 2*np.random.rand(100,2)
X = np.c_[X1,X2]
print("Input X shape: {}".format(X.shape))

y = 4*np.random.randn(100,1)
print("Input y shape: {}".format(y.shape))

reg = LinearRegression(fit_intercept=True)
reg.fit(X, y)

print("Intercept: {}\nEstimated coefficients: {}".format(reg.intercept_, reg.coef_))

# 预测
# X_new与X的维度应该一致,都是3列
X_new = np.array([[0,0,0],[2,1,2],[2,4,3]])
y_predict = reg.predict(X_new)
print("Predicted values:\n{}".format(y_predict))

#绘图
plt.plot(X, y, 'b.')
plt.plot(X_new, y_predict, 'r-')
plt.axis([0,2,0,15])
plt.show()

老师，如果我们的数据集没有办法分辨y和维度x是属于线性变化关系，也就是我们没办法提供类似y = a + bx的表达式，那么是不是我们就不应该使用简单线性回归去训练模型？因为很多时候在工作上，对于训练集里面的数据，我们是不太清楚维度与真实值之间的关系的（譬如：y=sales, x1=广告投入, x2=人力成本, x3=原材料成本）。我尝试了一下去算输入的X和y，结果很怪，绘图出来的分界线很差很怪，感觉它们不是线性关系，不应该用简单LR去做，麻烦老师纠正我的理解。

人工智能/第五阶段：机器学习-线性回归/多元线性回归 83楼

老师，不知道我这样理解对不对。

因为误差 = y-y_hat, 所以误差和y之间是有关系的，也就是跟我们想要求的模型(beta/w)是相关的。而我们假设了每个样本对应的误差为正态分布，所以当我们求出了所有样本误差对应概率的最大似然，其对应的theta就是我们要的模型theta*，而这个模型也等同于回归想要求出的模型。

人工智能/第五阶段：机器学习-线性回归/多元线性回归 84楼

L2正则项：

，

L2范数：

一个开根号一个没开根号，为什么说L2正则就是L2范数呢？

人工智能/第五阶段：机器学习-线性回归/正则化 85楼

在调用sklearn.linear_model 中的 Ridge对象 来做岭回归的时候，
视频中是调了alpha = 0.4 
请问这是一个经验值嘛？在现实如果调用的过程中应该怎么样调整呢？

人工智能/第五阶段：机器学习-线性回归/Lasso回归_Ridge回归_多项式回归 86楼

X_b[random_index:random_index+1]应该就是等价于X_b[random_index]的吧？

人工智能/第五阶段：机器学习-线性回归/梯度下降法 87楼

有两个X，Y = w0 + w1*X1 +w2*X2 ，换种写法的话，可以写为 Z = w0 + w1 * X + w2 * Y，按道理来说，得用三维坐标图才能看啊。另外，X_new和y_predict，应该只是三维坐标系中的三个点而已，应该不会成为直线。

人工智能/第五阶段：机器学习-线性回归/多元线性回归 88楼

发火箭这个例子，感觉用到分类里头会比较好。

人工智能/第五阶段：机器学习-线性回归/多元线性回归 89楼

最后保险开销charges出来的预测值最终是什么定论？x对应的维度参数和预测值的关系是什么呢？

人工智能/第五阶段：机器学习-线性回归/Lasso回归_Ridge回归_多项式回归 90楼

同学您好