免费看电视剧的网站2021深圳十大电子厂排名

张小明 2026/1/11 23:45:35
免费看电视剧的网站2021,深圳十大电子厂排名,北京seo公司工作,高性能网站建设进阶异常检测及修正 针对数据集进行模型检测#xff0c;检测异常后对异常值采用算法进行修正。 修正完后生成修正前后的对比效果图最近在搞数据清洗的时候发现个有意思的事儿——异常值这东西就像炒菜时的盐#xff0c;少了没味#xff0c;多了毁所有。今天咱们直接上代码实战检测异常后对异常值采用算法进行修正。 修正完后生成修正前后的对比效果图最近在搞数据清洗的时候发现个有意思的事儿——异常值这东西就像炒菜时的盐少了没味多了毁所有。今天咱们直接上代码实战看看怎么用Python揪出那些捣乱的异常点再给它整容成正常数据。先来点刺激的咱们自己造一组带坑的数据import numpy as np import matplotlib.pyplot as plt x np.linspace(0, 4*np.pi, 200) y np.sin(x) # 随机插入20个异常值 np.random.seed(42) outliers np.random.choice(200, 20, replaceFalse) y[outliers] np.random.uniform(-3, 3, 20) # 异常幅度±3 plt.figure(figsize(12,4)) plt.plot(x, y, label原始数据) plt.scatter(x[outliers], y[outliers], cred, label真实异常) plt.legend()![原始数据带异常点示意图]抓异常这事咱们用IQR四分位距方法更靠谱。比起简单粗暴的3σ原则IQR对极端值更敏感def detect_outliers_iqr(data): q1 np.percentile(data, 25) q3 np.percentile(data, 75) iqr q3 - q1 lower_bound q1 - 1.5*iqr upper_bound q3 1.5*iqr return (data lower_bound) | (data upper_bound) outlier_mask detect_outliers_iqr(y) detected_outliers np.where(outlier_mask)[0]这里有个坑要注意——IQR对周期性数据可能误伤但咱们的正弦波幅度稳定刚好适用。检测出的异常点用散点标出来更直观plt.figure(figsize(12,4)) plt.plot(x, y, alpha0.5) plt.scatter(x[detected_outliers], y[detected_outliers], corange, edgecolork, s80, label检测到的异常) plt.title(f检测到{len(detected_outliers)}个异常点)![异常点检测效果示意图]重头戏来了——异常修正。咱们不用简单的均值替换改用滑动窗口中位数这样能保留数据波动特征from scipy.ndimage import median_filter def smooth_outliers(data, window_size5): cleaned data.copy() median_vals median_filter(data, sizewindow_size) cleaned[outlier_mask] median_vals[outlier_mask] return cleaned y_cleaned smooth_outliers(y)这个median_filter是个好东西它用滑动窗口计算中位数。窗口大小选5刚好能覆盖正弦波的半个周期。对比下修正效果plt.figure(figsize(12,6)) plt.subplot(2,1,1) plt.plot(x, y, label修正前) plt.scatter(x[detected_outliers], y[detected_outliers], cred) plt.subplot(2,1,2) plt.plot(x, y_cleaned, cgreen, label修正后) plt.scatter(x[detected_outliers], y_cleaned[detected_outliers], clime, edgecolork) plt.tight_layout()![修正前后对比图]看对比图发现几个有意思的点峰值处的异常被拉回正常波形连续异常点会被窗口内的正常值中和正常数据段几乎不受影响不过这个方法在数据突变区域可能矫枉过正这时候需要调整窗口大小或者换用更复杂的插值方法。实际项目中建议先用这段代码快速验证再针对业务场景微调算法参数。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

张家界网站制作公司高端品牌网站建设兴田德润怎么联系

第一章:混合检索的 Dify 权限控制在构建基于 Dify 的智能应用时,混合检索机制与权限控制系统共同决定了信息访问的安全性与精准度。Dify 支持通过角色、用户组和数据策略实现细粒度的权限管理,确保不同用户只能访问其被授权的数据内容&#x…

张小明 2026/1/8 6:50:35 网站建设

花都网站建设策划建设银行的英语网站首页

VFlow是一个由Verizon Digital开发的开源流处理平台,专门设计用于处理大规模网络流量数据。该平台支持多种流量协议,包括IPFIX、NetFlow和sFlow,能够为企业提供高效、可扩展的数据处理解决方案。 【免费下载链接】vflow 项目地址: https:/…

张小明 2026/1/9 8:15:31 网站建设

设计一个自己公司网站开发网站综合建设笔记

欢迎大家加入[开源鸿蒙跨平台开发者社区](https://openharmonycrossplatform.csdn.net),一起共建开源鸿蒙跨平台生态。路由在 Flutter 中扮演着应用导航系统的核心角色,它如同人体的骨架一般支撑起整个应用的页面结构。一个设计良好的路由系统能够&#…

张小明 2026/1/8 14:44:26 网站建设

电商网站设计公司只选亿企邦html爱心特效代码

Arduino ESP32 联手阿里云IoT:从零搭建安全可靠的物联网系统 你有没有想过,一块几十元的开发板,加上一个云端平台,就能做出远程温湿度监控、智能灯控甚至小型工业报警系统?这不再是实验室里的概念,而是今天…

张小明 2026/1/9 6:18:39 网站建设

企业网站开发视频怎么查在哪个网站做的备案

7.抽象数据类型栈由可对它执行的操作来描述:1、可创建空栈;2、可将数据项添加到栈顶;3、可从栈顶删除数据项;4、可查看栈是否填满;5、可查看栈是否为空。将上述描述转换为一个类声明,公有成员函数提供了表示…

张小明 2026/1/7 23:43:06 网站建设