求解，哪家的怎样炸薯条好吃吃，求推荐！

冬奥会 | 林黛玉 | 供暖 | 混凝土 | 服装面料 | exo | 人口 | 坐月子 | 国家队 | 牙齿美白 | 玄幻小说 | 美杜莎 | 家庭 | 金平区 | 牙齿矫正 | 伊宁市 | 滦州市 | 男士护肤 | 法国 | 大城市 | 威士忌 | 梦想改造家 | 旅游推荐 | 孙悟空 | 机箱 | 周易 | 武术 | ISIS（伊斯兰国） | 艺考 | 骊威 | 温州市 | 易经 | 单片机 | 运动损伤 | 大白菜 | 爽肤水 | 电路设计 | 米酒 | 城市 | 韩国旅游 | 杭州生活 | 新风系统 | 机动车辆保险 | 戚继光 | 唇膏 | 寺庙 | 政府 | 貂蝉 | 咖啡馆 | 葫芦 | 动画制作 | 巴中市 | 美术生 | 房贷 | 意大利 | 暑假 | 香港购物 | 五粮液 | 台风 | 酱油 | 展会 | 名言 | 第三者 | 高三 | 徽州区 | 烹饪学校 | 三菱商事 | 梵蒂冈 | 红木艺术 | 螃蟹 | 自行车选购 | 内黄县 | 成都美食 | 果酒 | 少儿英语 | 酸奶 | 呼和浩特市 | 糕点 | 昌平区 | 宝洁（P&G） | 天气 | 任天堂 | 赛欧 | 火影忍者 | 英国 | 卫生间 | 葡萄 | 双色球 | 印度 | 赋 | 宇宙 | 智商 | 李白 | 延安市 | 合生元 | 洗面奶 | 青年旅舍 | 商标 | 西藏大学 | 抽脂 | 网盘 | 电梯 | 岳阳县 | 歌词 | 旅游线路 | 案件 | 卡通 | 卡地亚（Cartier） | 长春市 | 大红袍 | 少数民族 | 韭菜 | 通辽市 | 西点 | 铜陵市 | 魏无羡 | 食品 | 精酿啤酒 | 乾隆 | 肺炎 | 鲤鱼 | 显示器 | 论文写作 | 婴儿喂养 | 紫檀 | 牛初乳 | 郭德纲 | 老挝 | 中学 | 孝感市 | 嘉兴市 | 进贤县 | 祛痘印 | 鸭绿江 | 前端开发 | 中国教育 | 卫生巾 | 科幻 | 兰蔻（lancome） | 潮牌 | 视频剪辑 | 诛仙 | 余杭区 | 趣味 | 本田（honda） | 福州市 | 酱料 | 礼仪 | 纪录片 | 专升本 | 雪碧 | 写字楼 | 宜昌市 | 辣条 | gucci | 美容化妆 | 身材 | 泾川县 | 亲情 | 菠萝 | 安庆市 | 三国人物 | 朋友关系 | 恋爱心理 | 家装 | 新泰市 | logo设计 | 中国银行 | 大三学生 | 鱼丸 | 方便面 | 机车 | 红木家具 | 咖啡机 | 骨折 | 雅马哈 | 大城县 | 化妆技巧 | 海蛇 | 王建国 | 吸尘器 | 大学生创业 | 埇桥区 | 星座（占星） | 德国 | 陶瓷 | 城市生活 | 姓氏 | 孩子 | 肖战 | 电压 | 糖尿病 | 文景之治 | 江门市 | 铜仁市 | 果冻 | 海西蒙古族藏族自治州 | 狗粮 | 庐山 | 黑暗料理 |

你的位置：网站首页 >> 频道首页 >>美食 >>求解，哪家的怎样炸薯条好吃吃，求推荐！

求解，哪家的怎样炸薯条好吃吃，求推荐！

来源：蜘蛛抓取(WebSpider) 时间：2023-12-05 11:18 标签：怎样炸薯条好吃

Pytorch在梯度方面提供的功能，大多是为神经网络而设计的。而官方文档给出的定义和解释比较抽象。以下将结合实例，总结一下自己对Pytorch中梯度计算backward函数的理解。1. 简单的神经网络构建首先我们看一个非常简单的神经网络。假设x1，x2是神经网络的中间层，y是我们的输出层，Y是真实值，L是loss。w1和w2是对应于x1和x2的weight。上图用数学公式表示为：\(x2= w1 * x1\)
\(y = w2 * x2\)
\(L = Y - y\)
通常我们会把x1，w1，w2，x2，y使用PyTorch的Tensor进行表示。L也可以用Tensor表示(维度可能与其他Tensor不同)。其中，我们把需要自己设定的Tensor(即不是通过其他Tensor计算得来的)叫做叶子Tensor。比如x1，w1和w2就是所谓的叶子Tensor。在pytorch中，我们把上述模型表示出来。import torch
import numpy as np
x1 = torch.from_numpy( 2*np.ones((2, 2), dtype=np.float32) )
x1.requires_grad_(True)
#设置该tensor可被记录操作用于梯度计算
w1 = torch.from_numpy( 5*np.ones((2, 2), dtype=np.float32) )
w1.requires_grad_(True)
print("x1 =", x1)
print("w1 =", w1)
x2 = x1 * w1
w2 = torch.from_numpy( 6*np.ones((2,2), dtype=np.float32) )
w2.requires_grad_(True)
print("x2 =", x2)
print("w2 =", w2)
y = x2 * w2
Y = torch.from_numpy( 10*np.ones((2,2), dtype=np.float32) )
print("y =", y)
print("Y =", Y)
L = Y - y
x1 = tensor([[2., 2.],
[2., 2.]], requires_grad=True)
w1 = tensor([[5., 5.],
[5., 5.]], requires_grad=True)
x2 = tensor([[10., 10.],
[10., 10.]], grad_fn=<MulBackward0>)
w2 = tensor([[6., 6.],
[6., 6.]], requires_grad=True)
y = tensor([[60., 60.],
[60., 60.]], grad_fn=<MulBackward0>)
Y = tensor([[10., 10.],
[10., 10.]])
上述代码注意：设置一个tensor的 requires_grad为True 会保存该Tensor是否记录所有操作用于计算梯度，可直接在创建tensor时指定属性requires_grad = True，也可以使用函数x.requires_grad_(True)。
通过运算得到的Tensor（非自己创建的tensor），会自动被赋值grad_fn属性。该属性表示梯度函数。
2. 反向传播的梯度计算上述前向传播计算完成后，想要计算反向传播(BP)的梯度。基本原理即为求导的链式法则。上述网络的求导即为：PyTorch提供了backward函数用于计算梯度 ,这一求解过程变为:L.backward(torch.ones(2, 2, dtype=torch.float))
对于最后的Tensor L执行backward()函数，会计算之前参与运算并生成当前Tensor的叶子Tensor的梯度。其梯度值会保存在叶子Tensor的.grad属性中。比如上述网络中，x1，w1和w2就是所谓的叶子Tensor。print(x1.grad) # 查看L对于x1的梯度
print(w1.grad) # L对于w1的梯度
print(w2.grad)
tensor([[-30., -30.],
[-30., -30.]])
tensor([[-12., -12.],
[-12., -12.]])
tensor([[-10., -10.],
[-10., -10.]])
1. backward函数的gradient参数解释gradient 在PyTorch的官方文档上解释的比较晦涩，我理解这个参数表示的是网络的输出tensor(假设为L)对于当前调用backward()函数的Tensor(假设为Y)的导数，即\(gradient = \frac{\partial L}{\partial Y}\)。(1) 比如在我上述的模型输出tensor为L，当前调用backward的tensor也为为L,则gradient表示为\(\frac{\partial L}{\partial L}=1\)，也就是element全为1的Tensor。gradient维度需要与调用backward()函数的Tensor的维度相同。即L.backward(torch.ones(2, 2, dtype=torch.float))。(2) 又比如，假设我们不知道L关于y的函数表示，但知道L关于y的梯度（即\(\frac{\partial L}{\partial y}=-1\)）时，我们可以在特定位置,比如中间节点y调用backward函数，通过y.backward(-1 * torch.ones(2, 2, dtype=torch.float))来完成反向计算梯度过程。这样的设计通过链式法则，可以在特定位置求梯度值。(3) 对于L为标量（常数）的情况，可不指定任何参数，默认参数为torch.tensor(1)。对于L为高于1维的情况，则需要明确指定backward()的第一个参数。 2. backward函数的其他注意点(1) 默认同一个运算得到的Tensor仅能进行一次backward()。若要再次进行backward()，则要再次运算得到的Tesnor。(2) 当多个Tensor从相同的源Tensor运算得到，这些运算得到的Tensor的backwards()方法将向源Tensor的grad属性中进行数值累加。比如上述实例中，假设有另一个tensor L2是通过对x1的运算得到的，那么L2.backward()执行后梯度结果将累加到x1.grad中。print("x1.grad =",x1.grad) # 原来x1的梯度
L2 = x1 * x1
L2.backward(torch.ones(2, 2, dtype=torch.float))
print("x1.grad =", x1.grad) # 计算L2的backward后梯度结果将累加到x1.grad中
x1.grad = tensor([[-26., -26.],
[-26., -26.]])
x1.grad = tensor([[-22., -22.],
[-22., -22.]])
(3) 只有叶子tensor(自己创建不是通过其他Tensor计算得来的）才能计算梯度。否则对于非叶子的x1执行L.backwar()后，x1.grad将为None。定义叶子节点时需注意要直接用torch创建且不能经过tensor计算。例如将实例中的x1定义改为x1 = 2 * torch.ones(2, 2, requires_grad=True, dtype=torch.float) 其实它已经做了tensor计算，x1将不再是叶子，表达式中torch.ones()才是叶子。

求解，哪家的怎样炸薯条好吃吃，求推荐！

我要回帖

更多关于怎样炸薯条好吃的文章

随机推荐

求解，哪家的怎样炸薯条好吃吃，求推荐！

我要回帖

更多关于 怎样炸薯条好吃 的文章

随机推荐

更多关于怎样炸薯条好吃的文章