DH.NAntJob
3.7.2024.1008-beta0625
dotnet add package DH.NAntJob --version 3.7.2024.1008-beta0625
NuGet\Install-Package DH.NAntJob -Version 3.7.2024.1008-beta0625
<PackageReference Include="DH.NAntJob" Version="3.7.2024.1008-beta0625" />
paket add DH.NAntJob --version 3.7.2024.1008-beta0625
#r "nuget: DH.NAntJob, 3.7.2024.1008-beta0625"
// Install DH.NAntJob as a Cake Addin #addin nuget:?package=DH.NAntJob&version=3.7.2024.1008-beta0625&prerelease // Install DH.NAntJob as a Cake Tool #tool nuget:?package=DH.NAntJob&version=3.7.2024.1008-beta0625&prerelease
DH.NAntJob - 蚂蚁调度
蚂蚁调度AntJob-分布式任务调度系统
分布式任务调度系统,纯NET打造的重量级大数据实时计算平台,万亿级调度经验积累!面向中小企业大数据分析场景。
v4架构升级
v4版本是对v3版本的重构,主要是为了解决v3版本的一些问题,以及提供更多的功能。
v4版本亮点:
- []新增Http接入,由AntWeb提供调度服务,无需部署AntServer,满足轻量级项目需要。(进行中,等NewLife.Remoting提供WebsocketClient)
- 增强定时调度,支持指定Cron表达式,逐步替代Start+Step的恒定间隔定时调度
- []提前生成任务,提前下发给执行器,到时间后马上执行,提高任务执行时间精度。(待重新评估)
- []支持任务主动延迟,任务在执行中发现数据条件未满足时,可以向调度中心请求延迟一段时间后再执行,增加执行次数但不增加错误次数
- []扩充调度模式,常态化部署AntAgent,正式把Sql调度和C#调度加入主线,将来增加数据抽取和数据推送等多种调度模式
功能特点
AntJob的核心是蚂蚁算法:把任意大数据拆分成为小块,采用蚂蚁搬家策略计算每一块!
(蚂蚁搬家,一个馒头掉在地上,众多小蚂蚁会把馒头掰成小块小块往家里般!)
该算法设计于2008年,最开始用于处理基金公司的短信/邮件/传真群发(每批两百万)和电话话费分析(上百种国际长途计费规则),数据量不算大,但是有一定复杂度,并且要求支持持续处理(实时计算)以及出错重试。
2016年在中通快递某产品项目中使用该算法进行大数据实时计算,成功挑战每日1200万的订单。并进一步发展衍生成为重量级实时计算平台,集分布式计算、集群调度、配置中心、负载均衡、故障转移、跨机房冗余、作业监控告警、百亿级数据清洗、超大Redis缓存(>2T)于一身,于2019年达到每年万亿级计算量(2019年双十一日订单量破亿)。
AntJob是开源简化版,仅提供分布式计算和集中调度能力,支持百亿级调度。
AntJob主要功能点:
- 作业处理器。每一个最小业务模块实现一个处理器类,用于处理这一类作业。例如同步数据表时,每张表写一个处理器类,并在调度中心注册一个作业,调度中心按照作业时间切片得到任务,然后把任务(主要包含时间区间)分派给各个计算节点上的处理器类执行。又如,每天汇总计算是一个作业,而每月汇总计算又是另一个作业;
- 任务上下文。作业处理器类实例化以后,将反复向调度中心申请任务来执行,每个任务的上下文核心数据是时间区间(数据调度)、时间点(定时调度)、消息体(消息调度)。调度中心记录任务处理结果;
- 数据切片。支持按照时间区间(如5秒)把大数据切分为小片,也即是数据调度,处理过最大单表60亿行;
- 定时调度。支持定时执行(秒级)指定业务逻辑,每个执行时间点得到一个任务;
- 任务重试。每个任务完整记录处理结果,失败任务在延迟一段时间后将会自动重新分派(可能由原节点或其它节点执行);
- 任务重置。支持批量重置已执行完成的任务,让其再次执行处理;
- 作业面板。在Web控制台上可查看每个应用所有作业的运行状态,或修改参数;
- 作业重置。调整作业参数,让其再次处理某段时间的任务数据,例如重算过去一个月的数据;
新建项目
新建.net core 3.1项目,从nuget引用 AntJob。实例化一个调度器Scheduler,配置网络提供者。
using System;
using AntJob;
using AntJob.Providers;
using NewLife.Log;
namespace HisAgent
{
class Program
{
static void Main(string[] args)
{
XTrace.UseConsole();
var set = AntSetting.Current;
// 实例化调度器
var sc = new Scheduler();
// 使用分布式调度引擎替换默认的本地文件调度
sc.Provider = new NetworkJobProvider
{
Server = set.Server,
AppID = set.AppID,
Secret = set.Secret,
};
// 添加作业处理器
sc.Handlers.Add(new HelloJob());
// 启动调度引擎,调度器内部多线程处理
sc.Start();
Console.WriteLine("OK!");
Console.ReadKey();
}
}
}
然后添加第一个定时调度的作业处理器
using System;
using AntJob;
namespace HisAgent
{
internal class HelloJob : Handler
{
public HelloJob()
{
// 今天零点开始,每10秒一次
var job = Job;
job.Time = DateTime.Today;
job.Step = 10;
}
protected override Int32 Execute(JobContext ctx)
{
// 当前任务时间
var time = ctx.Task.Time;
WriteLog("新生命蚂蚁调度系统!当前任务时间:{0}", time);
// 成功处理数据量
return 1;
}
}
}
作业处理器必须继承自Handler,并且重写Execute实现业务逻辑。
我们这里的业务逻辑就是输出一行日志,其中的ctx.Task就是切分得到的任务上下文,Start是时间点。
构造函数中设定的开始时间和步进Step,仅用于首次注册作业到调度中心,后面就没有用处了。
为了编译观察,修改项目输出目录,在项目文件上点右键选“编辑项目文件”
<PropertyGroup>
<OutputType>Exe</OutputType>
<TargetFramework>netcoreapp3.1</TargetFramework>
<AssemblyVersion>1.0.*</AssemblyVersion>
<Deterministic>false</Deterministic>
<OutputPath>..\..\Bin\HisAgent</OutputPath>
<AppendTargetFrameworkToOutputPath>false</AppendTargetFrameworkToOutputPath>
</PropertyGroup>
编译执行
代码能编译通过,先跑起来看看
可以看到,调度器首先连接 tcp://127.0.0.1:9999,其次 tcp://ant.newlifex.com:9999 ,而上面代码中并没有提及这两个地址。其实这就是调度中心地址,默认本地用于调试,如果链接失败再连接公开版调度中心,位于配置文件中:
/// <summary>蚂蚁配置。主要用于网络型调度系统</summary>
[Config("Ant")]
public class AntSetting : Config<AntSetting>
{
#region 属性
/// <summary>调试开关。默认false</summary>
[Description("调试开关。默认false")]
public Boolean Debug { get; set; }
/// <summary>调度中心。逗号分隔多地址,主备架构</summary>
[Description("调度中心。逗号分隔多地址,主备架构")]
public String Server { get; set; } = "tcp://127.0.0.1:9999,tcp://ant.newlifex.com:9999";
/// <summary>应用标识。调度中心以此隔离应用,默认当前应用</summary>
[Description("应用标识。调度中心以此隔离应用,默认当前应用")]
public String AppID { get; set; }
/// <summary>应用密钥。</summary>
[Description("应用密钥。")]
public String Secret { get; set; }
#endregion
#region 方法
/// <summary>重载</summary>
protected override void OnLoaded()
{
if (AppID.IsNullOrEmpty())
{
var asm = Assembly.GetEntryAssembly();
if (asm != null) AppID = asm.GetName().Name;
}
base.OnLoaded();
}
#endregion
}
其实上面Main函数中已经看到从配置文件里面读取Server+AppID+Secret,该配置类读取的配置文件在这:
AppID默认取本应用名,Secret由调度中心生成并下发。
调度中心默认打开自动注册AutoRegistry,任意应用登录时自动注册,省去人工配置应用账号的麻烦。
企业内部正式场景使用时,为安全起见,建议关闭自动注册。
再来看看前面跑起来的日志
21:33:08.470 1 N - 启动任务调度引擎[AntJob.Providers.NetworkJobProvider],作业[1]项,定时5秒
21:33:08.471 1 N - HelloJob 开始工作 False 区间(2020-04-09 00:00:00, 0001-01-01 00:00:00) Offset=15 Step=10 MaxTask=8
21:33:08.587 5 Y Job HelloJob 停止工作
21:33:09.467 7 Y T [180.174.185.180:53926]上线!X3
启动了调度引擎,带有一个作业;
作业HelloJob,就是我们通过 sc.Handlers.Add(new HelloJob())``
添加进去的作业处理器实例;
HelloJob状态False,处于停止工作状态,那是因为作业注册后,默认都是停止状态,需要去web控制台配置参数后手工开启;
最后一个xxx上线,这是蚂蚁调度的Peers功能,可以探测得到当前应用下所有已连接节点的状态。当HisAgent部署于多个服务器时,每个进程都可以通过Peers得知其它节点的存在;
作业管理
不用关闭HistAgent客户端窗口,我们去线上web控制台看看 http://ant.newlifex.com/
可以看到应用节点在线,点击应用名进去作业面板
这就是我们的HelloJob作业,对应HisAgent中的HelloJob作业处理器。
它处于停用状态,下一次执行时间是 00:00:00 ,也就是今天零点,加上10秒步进,也远小于当前时间,因此,只要启用该作业,调度中心将会马上开始切分任务,并分派给客户都执行。
我们来点击红色叉叉,让它改变为启用状态
几秒后,客户端HisAgent欢快地跑起来!它正在以10秒间隔不断切分并执行任务。
刷新作业面板,可以看到,开始时间已经变为当前附近的时间,右边也有了执行次数。
点击作业名HelloJob,进去查看任务明细
任务切分后,插入作业任务表,此时状态为“就绪”,等待分发给客户端执行。
客户端执行后,向调度中心报告执行结果,可能“完成”,可能“错误”。
错误的任务,会在1分钟后,重新执行,最多连续错误10次。
双跑,沸腾吧,分布式计算
再开两个HisAgent进程,查看应用在线表,可以看到有三个节点在线。
HisAgent控制台中,可以看到各自都有机会分配了任务,每个任务有且仅有一个节点执行。
刷新作业HelloJob的任务列表,可以看到不同客户端执行了不同的任务。
设计概要
计算型应用(实现IJob)
计算应用->调度中心: app登录
note over 调度中心: app/secret
计算应用-->>调度中心: 注册作业
Web控制台->调度中心: 设置参数
Web控制台->调度中心: 启动作业
计算应用->调度中心: 申请作业分片
调度中心->计算应用: 返回分片
note over 计算应用: 多线程处理任务
计算应用-->调度中心: 上报局部状态
note over Web控制台: 作业状态看板
计算应用->调度中心: 处理成功
计算应用-->调度中心: 处理失败
系统架构
调度中心主从架构
计算应用->调度中心: 登录
调度中心->数据库: 连接
计算应用-->>调度中心2: 故障转移
调度中心2->数据库: 连接
计算应用2->调度中心: 登录
计算应用3->调度中心: 登录
计算应用4->调度中心: 登录
Web控制台-->调度中心: 监控
Product | Versions Compatible and additional computed target framework versions. |
---|---|
.NET | net5.0 was computed. net5.0-windows was computed. net6.0 was computed. net6.0-android was computed. net6.0-ios was computed. net6.0-maccatalyst was computed. net6.0-macos was computed. net6.0-tvos was computed. net6.0-windows was computed. net7.0 was computed. net7.0-android was computed. net7.0-ios was computed. net7.0-maccatalyst was computed. net7.0-macos was computed. net7.0-tvos was computed. net7.0-windows was computed. net8.0 was computed. net8.0-android was computed. net8.0-browser was computed. net8.0-ios was computed. net8.0-maccatalyst was computed. net8.0-macos was computed. net8.0-tvos was computed. net8.0-windows was computed. net9.0 was computed. net9.0-android was computed. net9.0-browser was computed. net9.0-ios was computed. net9.0-maccatalyst was computed. net9.0-macos was computed. net9.0-tvos was computed. net9.0-windows was computed. |
.NET Core | netcoreapp2.0 was computed. netcoreapp2.1 was computed. netcoreapp2.2 was computed. netcoreapp3.0 was computed. netcoreapp3.1 was computed. |
.NET Standard | netstandard2.0 is compatible. netstandard2.1 is compatible. |
.NET Framework | net45 is compatible. net451 was computed. net452 was computed. net46 was computed. net461 is compatible. net462 was computed. net463 was computed. net47 was computed. net471 was computed. net472 was computed. net48 was computed. net481 was computed. |
MonoAndroid | monoandroid was computed. |
MonoMac | monomac was computed. |
MonoTouch | monotouch was computed. |
Tizen | tizen40 was computed. tizen60 was computed. |
Xamarin.iOS | xamarinios was computed. |
Xamarin.Mac | xamarinmac was computed. |
Xamarin.TVOS | xamarintvos was computed. |
Xamarin.WatchOS | xamarinwatchos was computed. |
-
.NETFramework 4.5
- DH.NRemoting (>= 3.91.2024.1008-beta0243)
- DH.NStardust (>= 3.91.2024.1008-beta0339)
-
.NETFramework 4.6.1
- DH.NRemoting (>= 3.91.2024.1008-beta0243)
- DH.NStardust (>= 3.91.2024.1008-beta0339)
-
.NETStandard 2.0
- DH.NRemoting (>= 3.91.2024.1008-beta0243)
- DH.NStardust (>= 3.91.2024.1008-beta0339)
-
.NETStandard 2.1
- DH.NRemoting (>= 3.91.2024.1008-beta0243)
- DH.NStardust (>= 3.91.2024.1008-beta0339)
NuGet packages (1)
Showing the top 1 NuGet packages that depend on DH.NAntJob:
Package | Downloads |
---|---|
DH.NAntJob.Extensions
分布式任务调度系统,纯NET打造的重量级大数据实时计算平台,万亿级调度经验积累。 |
GitHub repositories
This package is not used by any popular GitHub repositories.
Version | Downloads | Last updated |
---|---|---|
3.7.2024.1008-beta0625 | 59 | 10/8/2024 |
3.7.2024.1008-beta0624 | 51 | 10/8/2024 |
3.7.2024.1008-beta0617 | 46 | 10/8/2024 |
3.7.2024.920-beta0142 | 65 | 9/20/2024 |
3.7.2024.918-beta1142 | 65 | 9/18/2024 |
3.7.2024.911-beta1521 | 68 | 9/11/2024 |
3.7.2024.911-beta1513 | 56 | 9/11/2024 |
3.7.2024.911-beta1038 | 60 | 9/11/2024 |
3.7.2024.911-beta0927 | 57 | 9/11/2024 |
3.7.2024.911-beta0832 | 57 | 9/11/2024 |
3.7.2024.911-beta0751 | 59 | 9/11/2024 |
3.7.2024.907-beta0300 | 63 | 9/7/2024 |
3.7.2024.907-beta0258 | 55 | 9/7/2024 |
3.7.2024.903-beta0548 | 60 | 9/3/2024 |
3.7.2024.903-beta0255 | 49 | 9/3/2024 |
3.7.2024.902-beta0243 | 56 | 9/2/2024 |
3.7.2024.828-beta0238 | 60 | 8/28/2024 |
3.7.2024.827-beta0708 | 68 | 8/27/2024 |
3.7.2024.826-beta0425 | 61 | 8/26/2024 |
3.7.2024.821-beta1445 | 80 | 8/21/2024 |
3.7.2024.820-beta0759 | 80 | 8/20/2024 |
架构升级